Luigi Curini è professore ordinario di scienza politica all’Università Statale di Milano e visiting professor alla Waseda University di Tokyo, Giappone.Curini è esperto di comportamenti elettorali, competizione politica e social media. A lui abbiamo chiesto tutto  su questo strumento chiave per la politica.

Come funziona tecnicamente la sentiment analysis e che tool si utilizzano?

Con sentiment analysis intendiamo la possibilità di analizzare dei testi per cercare di estrarre la posizione espressa su un determinato argomento. Cogliendone il tono positivo, negativo o neutrale.Ci sono tool a pagamento ed altri non a pagamento. I principali sono R e Phyton, due pacchetti statistici open source (gratuiti) che richiedono una certa conoscenza dei processi di machine learning per essere utilizzati. E poi ci sono le piattaforme a pagamento, molto più user-friendly, che non richiedono una conoscenza approfondita del linguaggio, ma che presentano un grande svantaggio: l’inconsapevolezza di che cosa ci sia dietro l’algoritmo che stiamo usando. Questo elemento è importante perché nell’analisi dei dati, algoritmi differenti producono risultati diversi e capire perché è importante. Ma non solo, non sapere come funziona la macchina significa non sapere quanto siano affidabili i dati che produce.

Qual è la differenza tra analisi quantitativa e analisi qualitativa?

L’aspetto quantitativo è il seguente: abbiamo dei tool di machine learning, macchine statistiche che prelevano ed elaborano dei dati per poi produrre un risultato, con la supervisione e l’analisi di statisti, economisti ed informatici.L’aspetto qualitativo consiste, invece, nel capire quali dati dare in pasto all’algoritmo. Questi dati devono essere decisi sulla base di una logica strategica secondo cui scegliamo di focalizzarci su delle keywords rispetto ad altre. Un informatico farà tutta l’analisi e poi c’è l’interpretazione del risultato, che è un aspetto fondamentale, perché non si tratta di soli numeri. Quindi c’è una distinzione forzata tra analisi qualitativa e quantitativa, ma ci deve essere un match tra le due cose, perché l’interpretazione di dinamiche sociali è fondamentale, tanto quanto la perfezione matematica della produzione algoritmica del risultato.

Ritorniamo ai tool. Quali sono quelli utilizzati dai team di comunicazione dei partiti politici per fare sentiment analysis?

Dipende se sono smart o meno. Se sono smart, sviluppano un proprio team di persone che hanno conoscenze specifiche e che controllano esattamente quello che stanno facendo, quindi non appaltano ad una società esterna l’analisi.Verosimilmente il team della Lega, capitanato da Luca Morisi, utilizza R e Phyton. Io se fossi un politico non utilizzerei mai software a pagamento, perché fidarsi di una piattaforma terza ha i suoi rischi. Al contrario, mi farei fare l’analisi internamente dal mio team, perché mi fido e perché sa esattamente che cosa sto facendo.

Come possiamo prescindere durante la sentimenti analysis a quelle reazioni che sono effettuate da profili falsi?

Non è semplice, peròci sono dei tool che permettono di assegnare ad una certa quantità di utenti la probabilità di essere un bot. E questa possibilità è determinata da diversi fattori: ha pochi follower, segue un sacco di persone e tende a retweettare sempre contenuti di terzi piuttosto che produrre qualcosa di proprio. Un account di questo genere ha una buona probabilità di essere considerato fake, anche se poi magari non lo è. Quindi noi possiamo utilizzare questi tool per individuare i profili falsi per poi eliminare quelli che al 90% sono dei bot, ottenendo un dato più pulito.

Focalizziamoci sulle recenti elezioni in Emilia Romagna. Come hanno usato Bonaccini e Borgonzoni la sentimenti analysis?

Chiaramente la Borgonzoni ha usato ‘La Bestia’ in modo approfondito, semplicemente perché è a traino di Salvini.Quello che fa ‘La Bestia’ è monitorare in senso lato il dibattito online e capire quali sono i principali trend. Parliamo di cose assolutamente banali che tutti i partiti dovrebbero fare e mi meraviglio che gli altri non lo facciano. Non è un problema della ‘Bestia’ di Salvini. Ma ritornando all’Emilia, il PD ha fatto un uso dei social molto intelligente, innanzitutto perché non si è parlato del PD. Nelle affissioni il verde ha sostituito il simbolo del Partito Democratico e se guardiamo i tweet di Bonaccini, la parola PD non esiste. Al contrario, la Borgonzoni ha utilizzato sempre il logo della Lega, quindi si  tratta di due linee differenti. Bonaccini ha intelligentemente parlato di temi concreti, piuttosto che di elementi astratti spesso alla base della comunicazione del PD, in cui gli esponenti stanno dentro la propria bolla autoreferenziale.

E per quanto riguarda la costruzione della propria propaganda elettorale? 

Per quanto riguarda invece la funzione propria della sentimenti analysis nella costruzione della propaganda, si fa sostanzialmente questo: si mappa il dibattito, si capisce come avviene, quali sono i punti di forza e di debolezza discussi online dai candidati. Poi grazie a questo tipo di informazioni si targhettizza il tipo di comunicazione. In termini ancora più concreti possiamo dire che si va su tutti i principali social media, si prendono in considerazione delle parole chiave, per esempio: Borgonzoni; Bonaccini; M5S, Emilia-Romagna e qualche altra parola. Si scarica dalla rete tutto quello che ha a che fare con queste keywords, e poi viene cancellato il rumore, ossia tutto quello che non riguarda l’evento che vogliamo analizzare (si può parlare di Emilia Romagna ma non delle elezioni). Il passo successivo è cogliere i segnali, applicando dei meccanismi di classificazione del testo. Faccio la sentiment analysis su Borgonzoni e Bonaccini e vedo come evolve nel tempo. Prima era super positiva e poi diventa negativa in un determinato giorno. Allora mi devo chiedere: perché era positiva in quel giorno e negativa in quell’altro giorno? Di che cosa si parlava in quel giorno? Dopo essermi posto queste domande, devo mappare l’evoluzione del sentiment legandola a dei fattori esterni. Facciamo un esempio: se in un determinato giorno la Borgonzoni ha ottenuto un sentiment negativo rispetto ai suoi post e parlava di tasse, mi renderò conto che lei non ottiene successo quando parla di tasse. Invece il giorno dopo scopro che è andata molto bene perché quando parla di Bibbiano riesce ad ottenere un boom di discussione. Ergo: se io fossi la Borgonzoni non parlerei più di tasse, ma parlerei solo di Bibbiano. Nel caso di Bonaccini, invece, mi rendo conto che le poche volte in cui ha parlato del PD ha ottenuto un sentiment disastroso, mentre ha funzionato quanto ha parlato dell’Emilia-Romagna, delle cose che ha fatto e dei cibi tradizionali della sua regione. Si utilizza quindi un’analisi sofisticata su una grande quantità di dati digitali per cercare di fornire delle linee di direzione ai candidati, sulla base dei post passati. Poi si cercano keywords relative a trend ed eventi relativi a quel partito politico. Là fuori c’è un ammontare di testi allucinante, la cosa importante è scremare quelli che sono utili, ossia quelli che sono funzionali a prendere delle direzioni di comunicazione politica.