Gå till huvudinnehåll
Översättare
Den här sidan har översatts automatiskt av Microsoft Translator: s maskinöversättningstjänst. Lära sig mer

Microsoft Translator blogg

Bings könsbundna översättningar tar itu med fördomar i översättningar

Förhindra könsrelaterad snedvridning
3D-återgivning av könssymboler.

Vi är glada att kunna meddela att det från och med idag finns maskulina och feminina alternativa översättningar tillgängliga när du översätter från engelska till spanska, franska eller italienska. Du kan prova denna nya funktion i både Bing-sökning Och Bing översättare vertikaler.

Under de senaste åren har området maskinöversättning (MT) revolutionerats av tillkomsten av transformatormodeller, vilket har lett till enorma kvalitetsförbättringar. Modeller som optimerats för att fånga de statistiska egenskaperna hos data som samlats in från den verkliga världen lär sig dock oavsiktligt eller förstärker till och med sociala fördomar som finns i dessa data.

Vår senaste version är ett steg mot att minska en av dessa fördomar, särskilt könsfördomar som är vanliga i MT-system. Bing Translator har alltid producerat en enda översättning för en inmatad mening även när översättningarna kunde ha haft andra könsvarianter, inklusive feminina och maskulina varianter. I enlighet med Microsofts principer för ansvarsfull artificiell intelligensVi vill se till att vi tillhandahåller korrekta alternativa översättningar och att vi är mer inkluderande för alla könen. Som en del av denna resa är vårt första steg att tillhandahålla feminina och maskulina översättningsvarianter.

Genus uttrycks på olika sätt på olika språk. På engelska kan ordet advokat till exempel syfta på en manlig eller kvinnlig person, men på spanska kan ordet advokat syfta på en manlig eller kvinnlig person, abogada skulle avse en kvinnlig jurist, medan abogado skulle avse en manlig. I avsaknad av information om genus för ett substantiv som "advokat" i en källmening kan MT-modellerna välja ett godtyckligt genus för substantivet på målspråket. Ofta överensstämmer dessa godtyckliga könstilldelningar med stereotyper, vilket vidmakthåller skadliga samhälleliga fördomar (Stanovsky et al., 2019; Ciora et al., 2021) och leder till översättningar som inte är helt korrekta.

I exemplet nedan ser du att när du översätter könsneutrala meningar från engelska till spanska följer den översatta texten den stereotypa könsrollen, dvs. advokat översätts som manlig.

Översättning med könsneutralitet
Skärmdump av en översättning av den engelska texten "Let's get our lawyer's opinion on this issue." till spanska med könsrelaterade fördomar.

Eftersom det inte finns något sammanhang i källsatsen som anger advokatens kön, skulle en översättning som utgår från en manlig eller kvinnlig advokat vara giltig i båda fallen. Nu producerar Bing Translator översättningar med både feminina och maskulina former.

Översättning av en könsrelaterad engelsk text till spanska
Skärmdump av översättning av den engelska texten "Let's get our lawyer's opinion on this issue." till spanska med könsspecifika översättningar.

Utformning av systemet

Vi strävade efter att utforma vårt system så att det uppfyller följande nyckelkriterier för att tillhandahålla könsbundna alternativ:

  1. De feminina och maskulina varianterna bör ha minimala skillnader förutom de som behövs för att förmedla könstillhörighet.
  2. Vi ville täcka in ett brett spektrum av meningar där flera genusalternativ är möjliga.
  3. Vi ville försäkra oss om att översättningarna bevarar betydelsen av den ursprungliga källsatsen.

Upptäcka könsrelaterad tvetydighet

För att korrekt upptäcka könsrelaterade tvetydigheter i källtexten använder vi oss av en modell för koreferens för att analysera inmatningar som innehåller animerade substantiv. Om en given inmatningstext till exempel innehåller ett könsneutralt yrkesord, vill vi bara tillhandahålla könsbundna alternativ för det när dess kön inte kan fastställas med hjälp av annan information i meningen. Till exempel: Vid översättning av en engelsk mening "The lawyer met her driver at the hotel lobby." till franska kan vi fastställa att advokaten är kvinna, medan könet på chauffören är okänt.

Översättning av en könsrelaterad engelsk text till franska
Skärmdump av översättning av den engelska texten "Advokaten mötte sin chaufför i hotellets lobby" till franska.

Skapa alternativ översättning

När källsatsen är tvetydigt könsbestämd undersöker vi översättningssystemets resultat för att avgöra om en alternativ könstolkning är möjlig. Om så är fallet går vi vidare för att bestämma det bästa sättet att revidera översättningen. Vi börjar med att konstruera en uppsättning kandidatmålöversättningar genom att skriva om den ursprungliga översättningen. Vi tillämpar språkliga begränsningar baserade på beroenderelationer för att säkerställa att de föreslagna alternativen är konsekventa och rensar ut de felaktiga kandidaterna.

I många fall har vi dock, även efter att ha tillämpat våra begränsningar, flera möjliga omskrivningar av den könade alternativa översättningen. För att bestämma det bästa alternativet utvärderar vi varje kandidat genom att poängsätta den med vår översättningsmodell. Genom att utnyttja det faktum att en bra genusomskrivning också är en korrekt översättning av källsatsen, kan vi garantera hög noggrannhet i vårt slutresultat.

Systemutformning av genusåterspegling
Ett diagram som visar systemets utformning för genusåterföring.

Utnyttja hanterade online-slutpunkter i Azure Machine Learning

Funktionen för könsrelaterade alternativ i Bing finns på hanterade online-slutpunkter i Azure Machine Learning. Hanterade online-slutpunkter ger ett enhetligt gränssnitt för att åberopa och hantera modellinstallationer på Microsoft-administrerad dator på ett nyckelfärdigt sätt. De gör det möjligt att dra nytta av skalbara och tillförlitliga slutpunkter utan att behöva bekymra sig om infrastrukturhantering. Den här inferensmiljön gör det också möjligt att behandla ett stort antal förfrågningar med låg latens. Vår förmåga att skapa och distribuera genusdebias-tjänsten med de senaste ramverken och teknikerna har förbättrats avsevärt genom användningen av hanterade inferensfunktioner i Azure Machine Learning. Genom att utnyttja dessa funktioner har vi kunnat hålla en låg COGS (Cost of Goods Sold) och säkerställa en enkel efterlevnad av säkerhets- och integritetsbestämmelser.

Hur kan du bidra?

För att underlätta arbetet med att minska könsrelaterade fördomar i MT publicerar vi nu en testkorpus som innehåller exempel på könsrelaterade översättningar från engelska till spanska, franska och italienska. Varje engelsk källsats åtföljs av flera översättningar som täcker varje möjlig könsvariation.

Vår testuppsättning är konstruerad för att vara utmanande, morfologiskt rik och språkligt varierande. Denna korpus har varit avgörande för vår utvecklingsprocess. Den utvecklades med hjälp av tvåspråkiga lingvister med stor erfarenhet av översättning. Vi släpper också ett tekniskt dokument där testkorpusen diskuteras i detalj och där metodiken och verktygen för utvärdering diskuteras.

GATE: En utmaning för könsneutrala översättningsexempel - Paper

GATE: En utmaning för könsrelaterade översättningsexempel - Testuppsättning

Vägen framåt

Genom det här arbetet vill vi förbättra kvaliteten på MT-utdata i fall av tvetydigt källkön, och underlätta utvecklingen av bättre och mer inkluderande verktyg för behandling av naturliga språk (NLP) i allmänhet. Vår första version fokuserar på översättning från engelska till spanska, franska och italienska. I framtiden planerar vi att utöka till nya språkpar, samt att täcka ytterligare scenarier och typer av fördomar.

Krediter:

Ranjita Naik, Spencer Rarrick, Sundar Poudel, Varun Mathur, Jeshwanth Kumar Chandrala, Charan Mohan, Lee Schwartz, Steven Nguyen, Amit Bhagwat, Vishal Chowdhary.