Com els biaixos en la generació d'imatges amb IA afecten la diversitat visual. Estratègies pràctiques per detectar-los i corregir-los, creant representació.
Més enllà del prompt: responsabilitat visual
Generar imatges amb IA no consisteix només a triar les paraules correctes, com vaig explicar en el meu post anterior. Darrere de cada prompt hi ha un imaginari cultural que influeix en els resultats. Si no en som conscients, el bias a Midjourney pot colar-se en les nostres creacions i donar lloc a representacions poc diverses o poc realistes.
Què és el bias en la generació d'imatges?
Quan parlem de bias (o biaix) en eines com Midjourney, ens referim a una tendència repetida en els resultats generats. En altres paraules, la IA no crea des de zero: interpreta els patrons que va aprendre de milions d'imatges. Això significa que, si en les dades predominaven certes representacions, aquestes es repeteixen, tot i que no siguin l'opció més justa o equilibrada. Per exemple, en demanar: "a doctor in a lab coat" és habitual que Midjourney mostri un home d'edat mitjana com a metge.
Això es deu al fet que durant el seu entrenament, el model va trobar una major quantitat de fotografies de metges homes que de metgesses dones, i aquesta desproporció es reflecteix en les imatges que genera.
El bias en la generació d'imatges no només influeix en les professions, sinó també en aspectes com:
-
Rols de gènere: associar el lideratge als homes i les cures a les dones.
-
Ètnia i cultura: sobrerepresentar persones blanques davant d'altres ètnies.
-
Edat: mostrar majoritàriament persones joves en contextos professionals.
-
Estil de vida: reforçar estereotips sobre el que significa "èxit" o "bellesa".
Detectar aquest fenomen és fonamental perquè condiciona la narrativa visual que estem construint. Si no hi intervenim, podem estar reforçant estereotips sense voler-ho.
D'on vénen aquests biaixos?
Els biaixos no apareixen per casualitat. Tenen el seu origen en com s'entrenen i s'ajusten els models d'IA. En el cas de Midjourney, els principals factors són:
-
Dades d'entrenament
Midjourney s'alimenta de milions d'imatges disponibles a Internet. Si en aquestes dades hi ha una representació desigual (per exemple, més fotos de metges homes que de dones), el sistema tendirà a replicar aquesta mateixa proporció. -
Optimització del model
Els algoritmes aprenen a generar allò que apareix amb més freqüència en les seves dades d'origen. Això significa que, fins i tot sense intenció, reforcen certs patrons i deixen en segon pla representacions menys comunes. -
Llenguatge dels prompts
Les paraules importen. Termes com "businessman" reforcen la imatge tradicional d'un home amb vestit, mentre que opcions més neutres com "business professional" obren la porta a resultats més diversos.
Com detectar el bias pas a pas
-
Mira amb atenció: Genera diverses imatges a partir del mateix prompt. Analitza no només l'estètica, sinó qui apareix (gènere, edat, ètnia, rol).
-
Compta els resultats: Si de 20 imatges d'un enginyer només 2 són dones, hi ha un desequilibri.
-
Recolza't en eines: Existeixen APIs i programaris d'anàlisi que poden identificar característiques com el gènere, l'edat o l'ètnia en imatges, retornant-te percentatges.
Estratègies per mitigar els biaixos
Detectar el problema és només el primer pas; el que importa és aplicar solucions concretes. Midjourney ofereix diverses formes d'ajustar els prompts i reduir els biaixos en les imatges que generem. Aquí tens algunes estratègies efectives:
- Usa llenguatge inclusiu: Les paraules importen. Canviar "businessman" per "business professional" evita reforçar estereotips i obre la porta a representacions més variades.
- Demana diversitat: Si necessites un grup de persones, indica-ho al prompt: gènere, edat, ètnies o fins i tot estil de vestimenta. Midjourney tendeix a seguir aquestes instruccions amb força fidelitat.
- Exclou estereotips: Usa --no si la teva versió de Midjourney ho permet. Si detectes que el teu prompt sempre genera un mateix patró (per exemple, "young white male"), pots excloure'l.
- Canvia la llavor: Prova amb --seed 42 o --seed 99 per veure diferents variants i escollir la més equilibrada.
- Combina descriptors positius: Afegir termes com "diverse", "inclusive", "multiethnic" o "balanced" sol donar lloc a imatges més variades sense necessitat d'allargar massa el prompt.
Bones pràctiques per a un procés transparent
Mitigar biaixos no és un esforç aïllat: ha de convertir-se en part del teu flux de treball creatiu. Documentar i revisar el que fas ajuda a millorar la qualitat i la coherència dels resultats. Aquí tens algunes recomanacions:
-
Registra cada prompt:
Guarda sempre el text exacte que vas usar, incloent-hi paràmetres com --seed, --ar o --v 7. Això permet repetir o ajustar resultats sense haver d'improvisar de nou. -
Anota les decisions clau:
Si vas decidir usar un --no per excloure un estereotip o vas afegir un descriptor com "diverse" o "inclusive", apunta-ho. Així tindràs claredat sobre per què vas arribar a una determinada imatge. -
Crea un historial de versions:
Genera diverses iteracions d'un mateix prompt i guarda-les amb la seva llavor associada. Això facilita comparar i seleccionar les opcions més equilibrades. -
Involucra perfils diversos:
La percepció dels biaixos no sempre és evident per a tothom. Demanar a col·legues o col·laboradors de contextos diferents que revisin les teves imatges pot aportar una mirada més àmplia. -
Sigues transparent en projectes professionals:
Si treballes per a clients, documentar com has ajustat els prompts i quines mesures has pres per evitar biaixos demostra un compromís amb l'ètica visual. Això suma valor al teu procés creatiu.
Cas d'estudi breu
Abans:
/imagine "a CEO portrait" --v 7
⭢ 80 % homes caucàsics.
Després:
/imagine "a CEO portrait of a 45-year-old Black woman, business suit, confident pose" --v 7 --ar 2:3
⭢ retrat professional de dona negra, equilibrat i representatiu.
Exemples visuals comparatius
Per il·lustrar l'impacte d'ajustar prompts i paràmetres, aquí hi ha una taula on pots inserir captures reals:








Conclusió
Ser conscients dels biaixos a Midjourney és part del procés creatiu. No es tracta només de generar imatges boniques, sinó de crear representacions més àmplies, reals i respectuoses. Amb petits ajustos en els prompts podem fer una gran diferència i construir una narrativa visual més diversa i inclusiva. Com més cuidem el que demanem, més valor tenen les imatges que obtenim.
Una última recomanació: per generar imatges amb responsabilitat visual, val la pena inspirar-se en la campanya "Keep Beauty Real" de Dove. Allà trobaràs un enfocament pràctic sobre com representar la diversitat i la bellesa real, que pot servir de guia per crear prompts que generin imatges més autèntiques i equilibrades.
També podràs descarregar un manual amb diverses paraules clau per generar millors prompts.
¡L'ètica també millora la teva creativitat!
I tu? Has provat a revisar els teus prompts amb aquesta mirada més crítica?


