Niente più discriminazioni di genere. Un obiettivo che Google annuncia nel dicembre 2018. Il riferimento è a Google Translate, il traduttore automatico multilingue più famoso al mondo. Lo scopo è l’eliminazione del gender bias, l’errore di resa in cui incorre l’algoritmo nel passaggio da una lingua composta da termini neutri a una che differenzia tra genere maschile e femminile. E così doctor, senza genere in inglese, dal 2018 non è più nella traduzione in italiano solo “dottore”, ma anche “dottoressa”.
Schermata 2020-09-22 alle 22.59.05

“O bir doktor”, nella traduzione dal turco all’inglese, era “lui è un dottore”. Solo dal 2018 viene tradotto anche come “lei è una dottoressa”

Se a distanza di due anni le dinamiche siano davvero cambiate lo dice Nicolas Kyser-Bril, redattore di AlgorithmWatch, organizzazione no-profit che si occupa di analizzare l’incidenza degli algoritmi in questioni di particolare rilevanza sociale. «Il nostro scopo è duplice: accertare gli errori degli erogatori di servizi online e verificare che quegli stessi operatori abbiamo risolto errori già segnalati in precedenza. Controllare Google Translate rientra nella nostra mission», racconta.
È un esperimento a comprendere quali siano stati i passi avanti realizzati da Google. Nella traduzione di undici professioni, passando da una lingua che utilizza i generi maschile e il femminile a una che utilizza solo il neutro, Nicolas scopre che delle 440 traduzioni analizzate (da e verso il tedesco, lo spagnolo, il polacco, il francese e l’italiano) molte sono connesse a stereotipi di genere. «Il riferimento non è solo alle professioni STEM (Science, Technology, Engineering and Mathematic, cioè le discipline scientifico-tecnologiche in cui prevale la presenza maschile, ndr). Si tratta di uno schema che vale per tutte le occupazioni». Qualche esempio: “vier Historikerinnen und Historiker” (in inglese: four male and female historians) viene tradotto in spagnolo – ma anche in francese, italiano e polacco – con “quattro storici”; “die präsidentin” diventa “il presidente”, benché la traduzione corretta sia “la presidente”.
Nella traduzione italiano-spagnolo e italiano-francese, “infermiere” diventa “infermiera”. Dall’inglese allo spagnolo e dall’inglese al francese, la traduzione è invece duplice. Provare per credere.
Schermata 2020-09-22 alle 23.47.02
Schermata 2020-09-22 alle 23.47.45
Schermata 2020-09-22 alle 23.48.08
Schermata 2020-09-22 alle 23.47.57
«Il meccanismo è il seguente – precisa Nicolas – Google traduce una frase da una lingua con maschile e femminile all’inglese, in cui la maggior parte dei nomi è neutro, senza genere. Quando la frase è tradotta dall’inglese alla lingua di destinazione, il genere viene stabilito sulla base di ciò che Google Translate considera più probabile, basandosi sulla quantità e qualità dei dati raccolti e utilizzati dall’algoritmo». È il bridging: l’inglese funziona come “ponte” tra due lingue. A spiegarlo ad AlgorithmWatch è un portavoce di Google: «la traduzione da una lingua a un’altra richiede un alto volume di dati bilingue, che non sempre esistono per tutte le combinazioni. Creare un ponte linguistico significa creare una traduzione dalla lingua X a quella Y attraverso una terza lingua Z. Un numero di dati bilingue sufficienti nella traduzione da X e Z e da Z e Y permette di giungere alla traduzione finale». Dunque, per tornare all’esempio: quando si traduce “infermiere” da una lingua influenzata dal genere all’inglese, nel processo di bridging il genere viene “perso”. E così la traduzione si focalizza sullo stereotipo. «Google traduce correttamente alcune parole, ma il meccanismo sembra incepparsi se viene inserita una seconda parola: per esempio, la traduzione funziona correttamente per “developer”, ma non per “the developer”», continua Nicolas. Errori comunque non sistematici, che possono essere dunque modificati. «Il problema si verifica soprattutto per termini singoli. Nel caso di testi più lunghi, grazie un contesto lessicale in cui molti termini sono influenzati dal genere, è più probabile che la traduzione sia corretta. In generale, gli algoritmi funzionano meglio quando si tratta delle traduzioni di testi composti da più di dieci parole».
Schermata 2020-09-23 alle 01.08.37
Schermata 2020-09-23 alle 01.08.46
Ad aprile 2020, Melvin Johnson, Senior Software Engineer, pubblica un articolo in cui spiega i passaggi seguiti da Google Translate: non solo cercare termini senza genere e provvedere alla traduzione al maschile e al femminile, ma anche accertarne l’accuratezza. E proprio in merito alle verifiche emergono nuovi dati. «182 traduzioni su 440 si sono rivelate false. Nella gran parte dei casi, gli errori si riferivano a forme femminili convertite al genere maschile. Sessantotto traduzioni erano state etichettate come “verificate” da Google», scrive Nicolas nell’articolo. Si pensa dunque a quali strategie adottare. «Ciò che voglio sottolineare», continua Nicolas, «è il fatto che sia stata fatta una scelta nel senso di ottimizzare il sistema di traduzione riferendosi all’inglese, una lingua senza genere a differenza dalla gran parte delle lingue europee. Assicurare dunque che la legislazione anti trust sia rispettata e che altri sistemi operativi, motori di ricerca e di traduzione possano raggiungere i consumatori europei, permetterebbe probabilmente di migliorare la qualità della traduzione».
Ma non solo. Se esiste una connessione tra machine learning e bias di genere, non è facile dirlo. I dati però sottolineano uno scenario poco equilibrato. Secondo il Gender Gap Report 2019 del World Economici Forum, nel campo dell’intelligenza artificiale il 78% delle persone impiegate è uomo. «Di qualunque posizione lavorativa si tratti, aumentare il numero di donne che attivamente partecipano allo sviluppo di nuovi strumenti come è Google Translate potrebbe con grande probabilità migliorare la qualità delle traduzioni di parole influenzate dal genere», dice Nicolas. «Traduzioni sbagliate di certo non aiutano nella corretta rappresentazione del mondo. E aiutano ancora meno nel porre rimedio ai continui ostacoli che le donne affrontano. Nella comunicazione, così come altrove».