L’Intelligenza Artificiale di Meta supporterà Wikipedia nel raccontare le donne

wikipedia-compie-20-anni

Piazze, statue, vie dedicate o intitolate a donne sono una rarità. E non solo in Italia. Allo stesso modo nella storia, nella musica, nell’arte sono pochissime le figure femminili ricordate e studiate. Certo internet avrebbe dovuto essere più inclusivo e incline alla diversità e invece si ripete quanto avviene tradizionalmente nella realtà. Così, ad esempio, solo il 20% delle biografie presenti su Wikipedia riguarda personaggi femminili. Parte da questa osservazione l’idea di Angela Fan, ricercatrice di META – Artificial Intelligence, che ha progettato un metodo scientifico aperto e riproducibile che contribuirà ad aumentare la rappresentazione culturale delle donne e delle minoranze sul web.

Wikipedia, tra i 10 siti web più visitati al mondo, spesso costituisce la prima risorsa consultata da coloro che cercano informazioni su figure storiche e di rilievo. Ma su Wikipedia non tutte le persone hanno lo stesso spazio. Secondo la Wikimedia Foundation, infatti, solo il 20% delle biografie presenti sul sito inglese riguarda personaggi femminili, e la percentuale diminuisce ulteriormente se si tratta di donne appartenenti a gruppi intersezionali, ad esempio scienziate oppure donne africane o asiatiche. Diversi studi, tra cui anche il report della Wikimedia Foundation, hanno segnalato lo squilibrio tra i generi presente sulla piattaforma. Ora le cause possono essere diverse, ma quello che importa alla ricercatrice è innanzitutto riuscire a trovare una soluzione che ponga rimedio a questo squilibrio

Il progetto di Meta
Nell’ambito del suo dottorato in informatica presso l’Université de Lorraine, in Francia, Angela Fan ha collaborato con la relatrice Claire Gardent allo sviluppo di un nuovo metodo per eliminare questo squilibrio usando l’intelligenza artificiale. Insieme, hanno creato un sistema in grado di eseguire ricerche e generare testi biografici in stile Wikipedia. La strada da percorrere è ancora lunga, ma l’auspicio è che questo nuovo metodo possa un giorno aiutare gli editor di Wikipedia a creare migliaia di biografie interessanti e accurate su personalità di rilievo non ancora presenti nel sito.

L’idea ddella ricercatrice ha origine nella sua esperienza personale e risale al tempo delle elementari, quando le venne assegnato il compito di scrivere un saggio su una figura storica. L’unico requisito richiesto era che nella biblioteca fosse presente un libro dedicato a tale personaggio. Le sarebbe piaciuto parlare di Eleanor Roosevelt, ma non avendo trovato nessun testo a supporto della sua ricerca fu costretta a optare per Teddy Roosevelt. Se immaginassimo lo stesso compito al giorno d’oggi, gli studenti nativi digitali consulterebbero senza dubbio internet e con molta probabilità Wikipedia.

Anche se Wikipedia offre milioni di articoli in inglese, sappiamo che esistono tantissime donne di cui le generazioni future non conosceranno né la storia né i traguardi raggiunti. Un esempio: nonostante la fisica canadese Donna Strickland abbia vinto il Premio Nobel per la fisica nel 2018, chiunque avesse cercato su Wikipedia informazioni che la riguardavano non ne avrebbe trovate, fino a quando, diversi giorni dopo l’assegnazione del premio, venne pubblicata una biografia su Wikipedia che ne illustrava l’eccezionale lavoro svolto.

Meta ritiene che un metodo scientifico aperto e riproducibile possa costituire un valido punto di partenza per risolvere questo problema. Per questo, sta rendendo disponibile un modello di Intelligenza Artificiale end-to-end che crea automaticamente articoli biografici di alta qualità su figure pubbliche importanti del mondo reale.

Come funziona il nuovo modello di Meta?

Il modello cerca nei siti web informazioni rilevanti sui personaggi e scrive una bozza in stile Wikipedia, completa di citazioni. Sarà inoltre disponibile a breve un nuovo set di dati creato per valutare le prestazioni del modello su 1527 biografie di donne appartenenti a gruppi “emarginati”. Questo set di dati può essere usato per preparare e perfezionare i modelli e valutare le prestazioni. Le voci generate dall’intelligenza artificiale potranno costituire un punto di partenza per le persone che scrivono contenuti per Wikipedia e per i fact-checker, contribuendo così ad aumentare la pubblicazione di biografie dedicate ai gruppi sottorappresentati, spiegano da Meta.

Il processo di creazione di una biografia inizia con l’uso di un’architettura RAG (Retrieval-Augmented Generation) basata sulla pre-formazione su larga scala, che insegna al modello a identificare solo le informazioni rilevanti, ad esempio il luogo di nascita o in cui una persona ha frequentato la scuola, durante l’elaborazione della biografia. Innanzitutto, il modello recupera da internet le informazioni rilevanti per la presentazione del soggetto, per poi generare quindi il testo e, nella terza fase, il modulo di citazione crea la bibliografia che riporta alle fonti consultate. A questo punto, il processo si ripete e ogni sezione preannuncia quella successiva, inserendo tutti gli elementi necessari per creare una biografia di Wikipedia affidabile, che includa i primi anni di vita del personaggio, l’istruzione e la carriera.

Queste sfide risultano più complesse nel caso dei gruppi emarginati, per i quali è disponibile una quantità di informazioni decisamente limitata. Qual è il prossimo passo quindi? Individuare altre persone sottorappresentate in Wikipedia, oltre ai gruppi femminili, come le persone transgender o non binarie, per le quali si registrano forme di pregiudizio che investono anche le fonti di informazioni online (ad esempio uno squilibrio tra il racconto della loro vita personale e i traguardi sociali, politici o culturali raggiunti).

***

La newsletter di Alley Oop

Ogni venerdì mattina Alley Oop arriva nella tua casella mail con le novità, le storie e le notizie della settimana. Per iscrivervi cliccate qui.

Per scrivere alla redazione di Alley Oop l’indirizzo mail è alleyoop@ilsole24ore.com