<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=336490476836615&amp;ev=PageView&amp;noscript=1">

Sentiment Analysis, un'arma in più per Piaggio

Gruppo Piaggio
people

Il Cliente

Il gruppo Piaggio è uno dei leader mondiali per quanto riguarda il mercato delle due ruote, simbolo dell'italia nel mondo grazie a marchi storici come Vespa, Moto Guzzi, Aprilia e molti altri.

Nel corso degli anni l'azienda è entrata con diversi account in piattaforme quali Facebook, Twitter, YouTube, Instagram, Pinterest e Google+. Ogni brand, dati i differenti valori da trasmettere e target da raggiungere, ha utilizzato un proprio stile di comunicazione.

Nel 2016 con una quota di mercato del 15,4% in Europa ha confermato la propria leadership, anche grazie alle vendite di veicoli commerciali, che sono stati 188.000. Il fatturato nello stesso anno è stato 1.313,1 milioni in crescita dell'1,4% rispetto al 2015.

gps_fixed

La Sfida

L'obiettivo generale del progetto era quello di analizzare i dati generati su Facebook per gestire la presenza social, definire il piano editoriale e supportare il marketing. In particolare, tre scopi sono stati propedeutici per il raggiungimento dell'obiettivo generale.

Il primo scopo da raggiugere riguardava la definizione di attività di marketing mirate attraverso la conoscenza degli interessi e dei gusti dei propri clienti. 

Il secondo riguardava l'individuazione degli argomenti di maggior successo e dai quali scaturivano le discussioni più accese. 

Infine il terzo scopo, a supporto del piano editoriale, era quello di definire un modello in grado di predire il successo che un post avrebbe potuto riscuotere. 

build

Le Tecnologie

Per raggiungere tali obiettivi sono state utilizzate tecnologie eterogenee tra di loro.

Nel caso del primo scopo si sono utilizzate tecniche di text mining che uniscono metodi di data mining e machine learning all'information retrivial e al natural language processing.

Per individuare gli argomenti più gettonati dai clienti sono state utilizzate tecniche di entity extraction, ossia l'individuazione di categorie come nomi di persona, di aziende, brand, luoghi di interesse turistico e tanto altro ancora all'interno di testo.

Per sviluppare il modello predittivo del successo di un post sono state utilizzate anche tecnologie di Sentiment Analysis per l'individuazione dei topic e delle emozioni.

Descrizione del progetto

Piaggio | Project Workflow | Sentiment Analysis

Descrizione sintetica

Nella prima fase di Business understanding si sono definiti i problemi generali, come il basso engagement delle pagine Piaggio, a differenza delle pagine degli specifici marchi (Aprilia, Moto Guzzi o Vespa). Successivamente i dati sono estratti da Fecebook tramite le API e con il linguaggio Python. 

Nella fase di preparazione i dati sono stati trattati considerando solo le feature ritenute interessanti per la costituzione del modello predittivo dell'engagement e dei suoi KPI. I dati quindi sono stati utilizzati per definire dei KPI che permettessero  di valutare l'efficacia e l'efficienza delle azioni messe in atto da Piaggio e dai competitor. 

Le piattaforme utilizzate

  • Facebook Graph: l'API per estrarre i dati e metterli a disposizione degli sviluppatori.
  • Python: per interagire con le API e per l'estrazione delle feature quindi per la definizione dei KPI . 
  • Dandelion.eu: per le operazioni di topic extraction e per ottenere la conoscenza di carattere semantico
  • Pentaho: per la creazione delle dashboard sull'engagement, sull'agreement o sul migliore momento per pubblicare (line publishing)
  • PostgreSQL: per creare i database dove immagazzinare dati estratti, che sono poi i data source delle dashboard

Risultati

L'analisi dei dati estratti dalle pagine social si è occupata inizialmente di valutare la forza della correlazione tra variabili dipendenti e la variabile indipendente, il valore dell'engagement.

Le variabili più correlate all'engagement sono risultate essere il tipo di allegato al post come image_share nel caso di Aprilia con un valore di 0.2 e photo per Ducati e Honda con il medesimo punteggio. Per Motoguzzi e Piaggio la presenza o assenza di emoji ha impattato sull'engagement, mentre per Vespa l'inserimento di un link all'interno di un post ha fatto aumentare la possibilità di ottenere un buon livello di engagement. Yamaha, d'altro canto, è risultata più legata alla presenza o assenza di hashtag. Per quel che concerne i best topic, i risultati sono stati «Sport Bike» per Aprilia, «Bucket List» e «ForeverYoung» per Vespa, «MGX – 21» e «OpenHouse» per Motoguzzi.

Successivamente per completare l'analisi si è cercato di mettere a punto alcuni modelli di regressione per descrivere e predire l'andamento dei dati raccolti. Si è testato il modello di regressione lineare classico e poi si è applicato un'algoritmo di feature selection per considerare soltanto le variabili dipendenti più esplicative della variazione del valore dell'engagement (Y). L'analisi della regressione è risultata soddisfacente nella fase descrittiva, meno in quella predittiva, per quest'ultima è necessario mettere a punto un modello di regressione logistica.

La testimonianza di Extra Smart

  • Davide Avella

    Lavorare con il gruppo Digital Marketing della Piaggio è entrare in contatto con un mondo. Un mondo a due ruote senza dubbio. Ma anche un mondo di numeri, analisi, strategie e pianificazione costante. Il progetto aveva l’obiettivo di arricchire questo aspetto: fornire agli esperti uno strumento in grado di coniugare i passi importanti fatti nella decodifica di opinioni ed emozioni all’esperienza di un brand simbolo in tutto il mondo del nostro Paese. La grande professionalità del team ci ha spinto a mettere in campo altrettanta accortezza e know how. Morale della favola: un tool “chiavi in mano” per orientarsi e affrontare le nuove sfide del social media marketing!

    Davide Avella, Data Scientist presso Extra Smart 

Sfida vinta con successo grazie a Extra Smart!

I numeri del gruppo Extra

people

80

persone

assignment_turned_in

97

certificazioni

thumb_up

5611

follower

directions_run

257

ore di ping pong all'anno

*Certificazioni in Hubspot, Openbravo, Pentaho, Red Hat, ISIPM, PRINCE2, ITIL, SCRUM