<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=1267344923293614&amp;ev=PageView&amp;noscript=1">

Smart Blog

Comprendere l'emotività di un testo con analisi semantica e machine learning

Davide Avella,

Big Data e IoT

La quarta rivoluzione industriale che stiamo vivendo è caratterizzata da una disponibilità di informazioni mai vista prima. Uno degli aspetti principali di questo fenomeno è infatti la produzione di grandi quantità di dati (Big Data): sia che riguardino macchinari smart che interagiscono in rete (Internet of Things), sia che riguardino tutti quelle informazioni prodotte direttamente dai consumatori tramite recensioni, commenti, chat e molto altro.

Non sempre le aziende colgono l'opportunità rappresentata dalla disponibilità di questi dati provenienti “dal basso”: grazie a tool hi-tech oggi è possibile raccoglierli, analizzarli e scoprire cosa hanno da dire i consumatori su un brand, prodotti o andamenti di mercato. Strumenti di Sentiment Analysis permettono addirittura di comprendere l'emozione trasmessa da un testo scritto. Ma secondo quali tecniche lavorano questi strumenti? Scopriamo insieme come operano l'analisi semantica e il Machine Learning!

 

Leggi subito "3 casi d'uso della Sentiment Analysis su Twitter"

 

 

 Analisi semantica

 

Analisi semantica | Sentiment Analysis

L'analisi semantica è il metodo più diffuso per l'analisi dei testi presenti sul web. La prima fase di questa analisi è quella di settaggio, dove vengono applicate una serie di regole fisse a un dataset di parole. Ad esempio, alla parola “bravo” sarà associato un valore positivo, mentre “cattivo” sarà collegato a un valore negativo. Quindi, se in un testo stiamo lavorando sulla parola chiave “cane”, il sentiment associato a tale parola cambierà a seconda che si tratti di “bravo cane” o “cane cattivo”.

Il grande vantaggio di questo sistema è l'autonomia: una volta inserito il dataset di parole e definite le regole per l'assegnazione del valore, l'intervento umano si renderà necessario solo una volta giunti alla lettura dei dati raccolti.

Spesso però una congiunzione o una negazione possono cambiare radicalmente il senso della frase: se il testo oggetto dell'analisi fosse “Il mio cane è bravissimo. È un così bravo cane che stamattina mi ha distrutto il divano a morsi!”.

L'analisi semantica difficilmente riesce a cogliere le forme di ironia e sarcasmo presenti nei commenti, arrivando a produrre un errore statistico anche fino al 15-20%. Per ovviare a questo, si potrebbe pensare di introdurre regole sempre nuove e più precise, ma è davvero difficile prevedere tutte le sfumature linguistiche esistenti.

Machine Learning

Machine learning | Sentiment Analysis

L'apprendimento automatico parte dall'assunzione che l'intervento della componente umana è imprescindibile. In questo sistema infatti una parola non viene assegnata a priori a una categoria: la parola “bravo” non sarà sempre assegnata a un valore positivo, ma la sua analisi si baserà sull'esperienza.

Esperienza che la macchina acquisisce soprattutto grazie all'intervento umano. L'operatore infatti inserisce e categorizza manualmente una serie di contenuti (100-200 sono sufficienti) e la macchina impara la ricorrenza di certe parole ed espressioni.

Nello specifico della definizione del sentiment, l'analista all'inizio classifica manualmente un insieme di messaggi che possono essere positivi, negativi o neutri e così, con un numero sufficiente di contenuti, la macchina sarà ottimizzata: avrà cioè sviluppato degli schemi di comprensione che gli permetteranno di classificare correttamente le parole e le espressioni ricorrenti quando le incontrerà nuovamente.

Se la macchina si imbatte in una frase con un forte contenuto ironico (es. “Buoni questi fagiolini, freddi al punto giusto!”) e assegna, sbagliando, un sentiment positivo, ecco che l'analista potrà intervenire e correggere l'assegnazione: è proprio da questa correzione che la macchina imparerà a individuare eventuali altre frasi ironiche, assegnando loro il valore più corretto.

Il Machine Learning si basa sul principio che un certo numero di contenuti inseriti dall'analista possono essere rappresentativi per categorizzare i linguaggio utilizzato dalla popolazione studiata. Qualora non fossero sufficienti l'analista potrà aumentare nel tempo il numero di contenuti classificati, permettendo così alla macchina di cogliere l'evoluzione del linguaggio utilizzato nella popolazione.

 Machine learning | Sentiment Analysis

Un vantaggio innegabile del Machine Learning è quello di non basarsi sulla lingua utilizzata (francese, italiano, arabo...) ma sulla ricorrenza statistica per categorizzare le parole. Infine, possiamo ben comprendere come il Machine Learning produca un errore statistico molto inferiore (siamo attorno al 2,7%) rispetto all'analisi semantica.

Analisi semantica e Machine Learning sono due tecniche sulle quali si basano gli strumenti di Sentiment Analysis. Se vuoi conoscere in dettaglio i risultati di un'analisi del sentiment, puoi scaricare gratuitamente 3 casi di Sentiment Analysis su Twitter. Ti basta un clic!

3 casi d'uso della Sentiment Analysis su Twitter!

Share this post

  

Commenti

New call-to-action

Iscriviti alla Newsletter

Condividi questo blog