Nyheter

Språkteknologi reproducerar stereotyper och osynliggör ickebinära

Hannah Devinney står bredvid dammen på Umeå universitetet.

Språkteknologier är inte könsneutrala. Kvinnor associeras exempelvis med hem och familj. Och i en ny avhandling konstaterar genusforskaren Hanna Devinney att språkdatan och språkteknologin är väldigt cisnormativ och om ickebinära nämns, sker det stereotypt och begränsande.

Tidigare svensk och internationell forskning har kunnat påvisa att språkteknologier inte är könsneutrala. I språkdata blir kvinnor associerat med hem, familj och relationella begrepp som ”kommunikation”, jämfört med män, som ofta behandlas som ”standardpersonen”. 

Däremot har man inom forskningen inte tidigare i någon större utsträckning undersökt hur den digitala maktojämlikheten påverkar minoritetsgrupper, till exempel icke-binära. Det är något som Hannah Devinney, doktorand vid institutionen för datavetenskap Umeå centrum för genusstudier, gjort med sitt avhandlingsprojekt, Gender and Representation: Investigations of Bias in Natural Language Processing

I avhandlingen undersöker hen på flera nivåer hur inkluderingen av ickebinära, trans- och queer-personer avspeglas i språkteknologier, samt vilka fördomar som förekommer. 

– Min avhandling fokuserar på hur språkteknologi behandlar genusgrupper olika, på olika nivåer, säger Hannah Devinney, till Fempers nyheter och fortsätter:

– Språkteknologi är en bred kategori av datavetenskap och inom den ryms maskinöversättning, internetsökning, ’chatbots’ och andra digitala assistenter, men också nyare teknologier såsom stora språkmodeller. Därför kan vi säga att språkteknologi är någonting som vi interagerar med varje dag, och därför är det jätteviktigt att förstå vilka risker det innebär och hur de kan påverka oss. 

Devinney har undersökt språkdata i form av texter som nyhetsartiklar eller andra artiklar, och det har hen gjort med hjälp av såväl kvalitativa som kvantitativa metoder. Den kombinationen har varit nödvändig, menar Devinney, därför att de datamängder som används för att träna moderna språkteknologiverktyg är nästan för stora för att analyseras enbart kvalitativt.

Språkdata – obalanserad och cisnormativ

Ett viktigt resultat är att språkdatan och språkteknologin är väldigt cisnormativ (vilket betyder att systemen utgår från att allas genus matchar det kön som de tilldelades vid födseln) och i den mån som ickebinära nämns, sker det stereotypt och begränsande. 

– Språkdata är mycket obalanserad, med många fler män än kvinnor, medan ickebinära personer är nästan osynliga i träningsdata. Det finns också mycket bevis på genus/könsstereotyper, till exempel att kvinnor oftare sammankopplas med hem och familj än andra grupper, eller att ickebinära personer är ”länkade” med termer som till exempel identitet och accepterande i båda träningsdata och modellutgång, säger hon.

En annan viktig slutsats är att fördomar kan vara komplicerade, därför att vissa mönster av ”bias” skiljer sig åt i engelsk jämfört med svensk nyhetsdata.

Med denna analys i grunden ges möjligheter att vidareutveckla metoder för att motverka den här typen av fördomar i språkteknologin. 

AI och språkdata reproducerar stereotyper

Den här typen av forskning är viktig, skriver Umeå universitet, eftersom vi dagligen möter maskingenerad bearbetning av mänskligt språk, både i form av vi ser (till exempel autokorrigering och översättningstjänster) och de vi inte ser (till exempel algoritmer). 

Språkteknologin ligger också till grund för verktyg inom artificiell intelligens (AI). 

– Jag hoppas att min forskning ska bidra till ett bredare, mer inklusivt samtal inom forskningsfältet språkteknologi. Trans- och ickebinära personer är oftast inte inkluderade i teorin/definitionen av ’genus’ i ’genusbias’ forskning. För att inkludera oss måste man tänka mer flexibelt, vilket också är bra för att få en bättre inkludering även av alla cispersoner (inte bara de som passar stereotyper), säger Hanna Devinney.

Efter disputationen kommer Devinney att fortsätta att jobba som postdoktor med Tema Genus vid Linköping universitet, med ett projekt som fokuserar på queer, trans och ickebinär representation i syntetiska data.

Prenumerera gratis på vårt
NYHETSBREV
Prenumerera gratis på vårt
NYHETSBREV