Fino ad ora, le nostre ricerche di informazione su qualsiasi motore di ricerca tenevano conto anche del linguaggio che usavamo. Ad esempio se dovessimo cercare il bollettino sul Coronavirus, non solo per l’Italia, ma anche per il resto dell’Ue, i primi siti cui verremmo indirizzati sarebbero prevalentemente italiani; questo perché l’algoritmo del motore di ricerca identifica la lingua madre di utilizzo.
Adesso Google, grazie all’intelligenza artificiale (AI) riuscirà ad estendere questa funzionalità così da permettere una ricerca al 100% immersiva. Infatti i ricercatori del colosso di Mountain View propongono una nuova tecnica in cui le menzioni specifiche della lingua si risolvono in una nuova ricerca, non più per parole chiavi, ma per conoscenza di ogni singola menzione. In poche parole qualsiasi termine che noi vorremo cercare verrà codificato in base al significato che ha in tutto il mondo. Per la prima volta Google metterà a disposizione di tutti un motore di ricerca in versione dizionario digitale con una copertura di oltre cento lingue e venti milioni di collegamenti, i quali sono essenzialmente dei database che comprendono informazioni su: persone, luoghi, oggetti etc.
Il colosso californiano lavora a questo progetto da anni. Era il 2012 quando Google lanciò un algoritmo del sapere chiamato Knowledge Graph che mirava a migliorare i risultati di ricerca su miliardi di argomenti raccolti da fonti quali Wikipedia, Cia, Factbook e Wikidata.
Il collegamento che Google invece metterà in piedi adesso non permetterà una relazione tra le diverse lingue sulla ricerca del termine desiderato da ciascun utente, ma includerà informazioni essenziali del termine stesso. Come detto, ci troveremo di fronte al primo dizionario digitale multilingua. I due modelli da cui Google prenderà spunto per mettere appunto questo nuovo algoritmo saranno Wikidata e Wikipedia.
I ricercatori hanno estratto un set di dati su larga scala (si parla di 684 milioni di citazioni in 104 lingue collegate a WikiData), che secondo loro è almeno sei volte più grande dei set di dati utilizzati in precedenti lavori di collegamento. Inoltre, i coautori hanno creato un set di dati corrispondente (denominato Mewsli-9) che abbraccia un insieme diversificato di lingue (incluse 289.087 citazioni che appaiono in 58.717 articoli di WikiNews). Quanto permesso dall’AI porterà una svolta nella ricerca per ciascuno di noi, ma anche un cambiamento radicale nel mondo del lavoro.
Per saperne di più, continua a leggere su Venturebeat