Przejdź do głównej zawartości
Translator
Ta strona została automatycznie przetłumaczona przez usługę tłumaczenia maszynowego Microsoft Translator. Dowiedz się więcej

Blog Microsoft Translator

Tłumaczenia Bing oparte na płci zwalczają stronniczość w tłumaczeniu

Uprzedzenia ze względu na płeć
Renderowanie 3D symboli płci.

Z przyjemnością ogłaszamy, że od dziś dostępne są męskie i żeńskie alternatywne tłumaczenia podczas tłumaczenia z angielskiego na hiszpański, francuski lub włoski. Możesz wypróbować tę nową funkcję w obu Wyszukiwanie Bing I Translator Bing Pionowe centra.

W ciągu ostatnich kilku lat dziedzina tłumaczenia maszynowego (MT) została zrewolucjonizowana przez pojawienie się modeli transformatorów, co doprowadziło do ogromnej poprawy jakości. Jednak modele zoptymalizowane pod kątem przechwytywania właściwości statystycznych danych zebranych ze świata rzeczywistego przypadkowo uczą się, a nawet wzmacniają uprzedzenia społeczne znalezione w tych danych.

Nasze najnowsze wydanie jest krokiem w kierunku zmniejszenia jednego z tych uprzedzeń, w szczególności uprzedzeń związanych z płcią, które są powszechne w systemach MT. Usługa Tłumacz Bing zawsze tworzyła jedno tłumaczenie zdania wejściowego, nawet jeśli tłumaczenia mogły mieć inne odmiany płci, w tym warianty żeńskie i męskie. Zgodnie z Zasady odpowiedzialnej sztucznej inteligencji firmy Microsoft, chcemy mieć pewność, że zapewniamy poprawne alternatywne tłumaczenia i są bardziej otwarte dla wszystkich płci. W ramach tej podróży naszym pierwszym krokiem jest dostarczenie żeńskich i męskich wariantów tłumaczenia.

Płeć jest wyrażana w różny sposób w różnych językach. Na przykład w języku angielskim słowo prawnik może odnosić się do osoby płci męskiej lub żeńskiej, ale w języku hiszpańskim, Abogada • odnosiłby się do kobiety prawnika, podczas gdy Abogado • odnosiłby się do męskiego. W przypadku braku informacji o rodzaju rzeczownika, takiego jak "prawnik" w zdaniu źródłowym, modele MT mogą uciekać się do wyboru dowolnego rodzaju rzeczownika w języku docelowym. Często te arbitralne przypisania płci są zgodne ze stereotypami, utrwalając szkodliwe uprzedzenia społeczne (Stanovsky i in., 2019; Ciora i in., 2021) i prowadzące do tłumaczeń, które nie są w pełni dokładne.

W poniższym przykładzie można zauważyć, że podczas tłumaczenia neutralnych płciowo zdań z angielskiego na hiszpański, przetłumaczony tekst podąża za stereotypową rolą płci, tj. prawnik jest tłumaczony jako mężczyzna.

Tłumaczenie z uprzedzeniami ze względu na płeć
Zrzut ekranu z tłumaczeniem angielskiego tekstu "Let's get our lawyer's opinion on this issue." na język hiszpański z uprzedzeniami płciowymi.

Ponieważ w zdaniu źródłowym nie ma kontekstu, który sugerowałby płeć prawnika, sporządzenie tłumaczenia z założeniem, że prawnik płci męskiej lub żeńskiej byłoby ważne. Teraz Translator Bing tworzy tłumaczenia zawierające zarówno formy żeńskie, jak i męskie.

Tłumaczenie niejednoznacznego tekstu angielskiego na język hiszpański
Zrzut ekranu z tłumaczeniem angielskiego tekstu "Let's get our lawyer's opinion on this issue." na język hiszpański z tłumaczeniami uwzględniającymi płeć.

Projektowanie systemów

Naszym celem było zaprojektowanie naszego systemu tak, aby spełniał następujące kluczowe kryteria dostarczania alternatyw dla płci:

  1. Warianty żeńskie i męskie powinny mieć minimalne różnice, z wyjątkiem tych, które są potrzebne do przekazania płci.
  2. Chcieliśmy objąć szeroki zakres zdań, w których możliwe są alternatywy dla wielu płci.
  3. Chcieliśmy mieć pewność, że tłumaczenia zachowają znaczenie oryginalnego zdania źródłowego.

Wykrywanie niejednoznaczności płci

Aby dokładnie wykryć niejednoznaczność płci w tekście źródłowym, używamy modelu koreferencyjnego do analizy danych wejściowych zawierających rzeczowniki ożywione. Na przykład, jeśli dany tekst wejściowy zawiera neutralne płciowo słowo zawodowe, chcemy zapewnić alternatywy płciowe dla niego tylko wtedy, gdy jego płeć nie może być określona przez inne informacje w zdaniu. Na przykład: Tłumacząc angielskie zdanie "Prawnik spotkał się ze swoim kierowcą w hotelowym lobby." na francuski możemy ustalić, że prawnik jest kobietą, podczas gdy płeć kierowcy jest nieznana.

Tłumaczenie niejednoznacznego tekstu angielskiego płci na język francuski
Zrzut ekranu z tłumaczeniem angielskiego tekstu "Prawnik spotkał się ze swoim kierowcą w hotelowym lobby." na język francuski.

Generowanie alternatywnego tłumaczenia

Gdy zdanie źródłowe jest niejednoznaczne, badamy wyniki naszego systemu tłumaczenia, aby zdecydować, czy możliwa jest alternatywna interpretacja płci. Jeśli tak, przystępujemy do określenia najlepszego sposobu korekty tłumaczenia. Zaczynamy od skonstruowania zestawu potencjalnych tłumaczeń docelowych, przepisując oryginalne tłumaczenie. Stosujemy ograniczenia językowe oparte na relacjach zależności, aby zapewnić spójność proponowanych alternatyw i przycinać błędnych kandydatów.

Jednak w wielu przypadkach, nawet po zastosowaniu naszych ograniczeń, pozostaje nam wiele kandydatów do przepisania alternatywnego tłumaczenia płciowego. Aby określić najlepszą opcję, oceniamy każdego kandydata, oceniając go za pomocą naszego modelu tłumaczenia. Wykorzystując fakt, że dobre przepisanie płci będzie również dokładnym tłumaczeniem zdania źródłowego, jesteśmy w stanie zapewnić wysoką dokładność w naszym ostatecznym wyniku.

Projektowanie systemowe zmiany płci
Diagram przedstawiający projekt systemowy zmiany płci.

Wykorzystanie zarządzanych punktów końcowych online w usłudze Azure Machine Learning

Alternatywna funkcja Bing ze względu na płeć jest hostowana na Zarządzane punkty końcowe online w usłudze Azure Machine Learning. Zarządzane punkty końcowe online zapewniają ujednolicony interfejs do wywoływania wdrożeń modeli i zarządzania nimi na komputerach obliczeniowych zarządzanych przez firmę Microsoft w sposób "pod klucz". Pozwalają nam one korzystać ze skalowalnych i niezawodnych punktów końcowych bez martwienia się o zarządzanie infrastrukturą. To środowisko wnioskowania umożliwia również przetwarzanie dużej liczby żądań z małymi opóźnieniami. Nasze możliwości tworzenia i wdrażania usługi debias płci przy użyciu najnowszych struktur i technologii zostały znacznie ulepszone dzięki użyciu funkcji wnioskowania zarządzanego w usłudze Azure Machine Learning. Wykorzystując te funkcje, byliśmy w stanie utrzymać niski COGS (koszt sprzedanych towarów) i zapewnić proste bezpieczeństwo i zgodność z przepisami dotyczącymi prywatności.

Jak możesz wnieść swój wkład?

Aby ułatwić postęp w ograniczaniu uprzedzeń ze względu na płeć w MT, publikujemy korpus testowy zawierający niejednoznaczne pod względem płci przykłady tłumaczeń z języka angielskiego na hiszpański, francuski i włoski. Każdemu angielskiemu zdaniu źródłowemu towarzyszy wiele tłumaczeń, obejmujących każdą możliwą odmianę płci.

Nasz zestaw testowy jest skonstruowany tak, aby był wymagający, bogaty morfologicznie i zróżnicowany językowo. Ten korpus odegrał kluczową rolę w naszym procesie rozwoju. Został opracowany z pomocą dwujęzycznych lingwistów z dużym doświadczeniem tłumaczeniowym. Wydajemy również dokument techniczny, który szczegółowo omawia korpus testu oraz metodologię i narzędzia oceny.

GATE: Wyzwanie stawiane przed przykładami tłumaczeń niejednoznacznych pod względem płci – artykuł

GATE: Zestaw wyzwań dla niejednoznacznych pod względem płci przykładów tłumaczeń – zestaw testowy

Dalsze działania

Dzięki tym pracom dążymy do poprawy jakości wyników tłumaczenia maszynowego w przypadkach niejednoznacznej płci źródłowej, a także do ułatwienia rozwoju lepszych i bardziej integracyjnych narzędzi przetwarzania języka naturalnego (NLP) w ogóle. Nasze pierwsze wydanie koncentruje się na tłumaczeniu z angielskiego na hiszpański, francuski i włoski. W przyszłości planujemy rozszerzyć działalność na nowe pary językowe, a także uwzględnić dodatkowe scenariusze i rodzaje uprzedzeń.

Kredyty:

Ranjita Naik, Spencer Rarrick, Sundar Poudel, Varun Mathur, Jeshwanth Kumar Chandrala, Charan Mohan, Lee Schwartz, Steven Nguyen, Amit Bhagwat, Vishal Chowdhary.