<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=1267344923293614&amp;ev=PageView&amp;noscript=1">

Blog

Il Virtual Assistant di SoundHound per l'automotive: il successo di Houndify, l’assistente vocale intelligente

Francesca Passaglia

Francesca Passaglia, 26 maggio 2021 | Intelligenza Artificiale Natural Language Processing

I Virtual Assistant stanno diventando compagni della nostra vita quotidiana, ne facciamo uso da tempo, ad esempio nelle automobili, settore in cui hanno fatto comparsa a partire dal 2017.

Uno dei più importanti produttori di assistenti vocali verticalizzati nel mondo automotive è SoundHound, cliente del Gruppo Extra da oltre due anni, con il quale è nata una collaborazione di successo proprio per la localizzazione dell’assistente Houndify per la lingua italiana. Ecco che, in questa intervista, vogliamo cercare di approfondire quali sono state, e sono tuttora, le maggiori chiavi di successo di Houndify. Abbiamo incontrato Andrew Richards, Direttore del Business Development di SoundHound Europa a cui abbiamo fatto alcune domande.

Quando e come è stata fondata SoundHound e qual è la sua missione e visione?

AR: Nel 2005, un gruppo di laureati di Stanford ha intrapreso un viaggio per aiutare le persone a parlare ad una macchina proprio come noi. Per oltre 10 anni, Keyvan Mohajer, cofondatore e CEO di SoundHound Inc., e il suo team hanno lavorato per rivoluzionare l'interazione vocale uomo-computer. Fino ad allora, tutte le interazioni vocali si basavano su un processo in due fasi: la sintesi vocale e poi la trasformazione del testo in significato. I nostri fondatori sapevano che affinché un vero motore vocale potesse prosperare, era necessario comprendere il parlato direttamente, proprio come fanno gli umani.

Nel 2015 abbiamo introdotto la piattaforma Houndify Voice AI. Con le rivoluzionarie tecnologie Speech-to-Meaning® e Deep Meaning Understanding ™ come fondamento, Houndify ha offerto un'interazione vocale senza precedenti e le sue capacità sono ancora ineguagliate fino ad oggi.

La nostra visione rimane quella del 2005: creare una piattaforma di intelligenza artificiale vocale che superi le capacità umane e apporti valore e gioia attraverso un ecosistema di miliardi di prodotti potenziati da opportunità di innovazione e monetizzazione. Questa visione è vissuta dalla nostra missione: Houndify tutto! Abilita la voce nel mondo con l'intelligenza conversazionale.

In un periodo storico dell'IT in cui proliferano i Virtual Assistant e gli assistenti vocali, su cosa si è concentrato SoundHound per distinguersi dalla concorrenza e assumere una posizione di leader?

AR: Il settore automobilistico è stato uno dei primi ad adottare la tecnologia AI vocale. L'aggiunta di un'interfaccia utente vocale nei veicoli è stata un'estensione naturale dei primi sforzi per rendere la guida più sicura e comoda. Collaborando con SoundHound, i nostri partner automobilistici sono stati in grado di realizzare la promessa di esperienze vocali attraverso le tecnologie Speech-to-Meaning® e Deep Meaning Understanding ™ di Houndify e sviluppare assistenti vocali veramente conversazionali.

La nostra soluzione consente alle case automobilistiche di fornire un assistente conversazionale con connettività cloud e accesso a centinaia di domini di contenuti nel nostro SDK, inclusi meteo, rapporti di borsa e informazioni sui POI (punti di interesse). Oltre alla capacità di parlare in modo naturale e ottenere informazioni utili, i conducenti possono effettuare chiamate, inviare messaggi e aggiungere playlist per migliorare le loro esperienze di ascolto della musica.

Le prime partnership automobilistiche includevano Hyundai, PSA Groupe (ora Stellantis) e Mercedes-Benz. In qualità di leader nella tecnologia Voice AI per l'automotive, abbiamo continuato ad espandere le nostre partnership esistenti per includere più veicoli in mercati più globali, così come nuove partnership, tra cui Honda e Kia Seltos, con altre ancora da annunciare.

Quali sono le chiavi che rendono Houndify un assistente vocale di successo nei domini automobilistici? E perché automobilistico?

AR: I nostri partner automobilistici sono sempre stati lungimiranti e innovativi. Comprendono la complessità dello sviluppo di un'interfaccia vocale che superi le aspettative dei clienti oggi e continuano a migliorare tale esperienza nel tempo. Sanno anche che la chiave per far interagire i loro clienti con un assistente vocale risiede nella capacità dei conducenti (e in alcuni casi dei passeggeri) di interagire con le loro auto proprio come farebbero con un'altra persona e ottenere risultati rapidi e precisi ogni volta.

Quando si progetta un'esperienza vocale in auto, la sicurezza è sempre un obiettivo numero uno. Per i nostri partner, l'assistente vocale dove elaborare il parlato naturale in un ambiente rumoroso e fornire risultati accurati che non richiedano al conducente di guardare lo schermo dall'alto in basso. Inoltre, l'assistente vocale deve adattarsi all'esperienza complessiva in auto e passare senza problemi dal controllo tattile ai comandi vocali.

SoundHound è stato in grado di fornire una soluzione end-to-end a queste case automobilistiche, con Houndify, inclusa una frase sveglia personalizzata, aumentando l'affinità con il marchio e ispirando fedeltà.

Pensi che l'esperienza di successo nel settore automobilistico possa essere replicata in altri domini?

AR: Houndify ha già ottenuto numerosi successi in altri settori. All'inizio del 2019, abbiamo annunciato una partnership con Pandora, il più grande fornitore di musica in streaming negli Stati Uniti, per potenziare la modalità vocale. Utilizzando la modalità vocale, gli utenti di Pandora possono avere esperienze di ascolto della musica intuitive e a mani libere. Pandora continua a innovare le proprie esperienze di intelligenza artificiale vocale per includere annunci vocali interattivi e più modi per personalizzare l'esperienza di ascolto della musica.

Sia Harman che Deutsche Telekom hanno collaborato con noi per altoparlanti abilitati alla voce e altre esperienze clienti, e proprio l'anno scorso abbiamo annunciato partnership sia con Snap Inc. che con Mastercard.

La funzione Scansione vocale di Snapchat consente agli snapchatter di trovare rapidamente le lenti giuste per aumentare i loro volti e il mondo che li circonda, semplicemente chiedendo. L'assistente vocale risolve il problema degli utenti che cercano in una libreria di oltre 400.000 obiettivi per trovare quello che si adatta al loro umore. Utilizzando Voice Scan, gli snapchatter possono scattare selfie migliorati con l'obiettivo giusto senza dover cambiare la posizione della fotocamera o muovere le mani.

Nell'agosto 2020, Mastercard ha annunciato una partnership con SoundHound per aggiungere la potenza di Houndify alle sue soluzioni AI Powered Drive Through per Quick Service Restaurants (QSR). Le avanzate tecnologie AI di Houndify hanno fornito l'interfaccia senza soluzione di continuità che consente al sistema di ordinazione di comprendere facilmente ordini complessi, sostituzioni e richieste speciali in modo accurato e rapido. Continuiamo inoltre a espanderci in nuovi settori, tra cui IoT, ospitalità, banche e finanza e soluzioni per le imprese.

Le sfumature linguistiche e il multilinguismo sono rilevanti in un mercato globale: puoi dirci in che misura nella tua esperienza le hai prese in considerazione?

AR: Crediamo che ogni marchio dovrebbe avere una voce (un assistente vocale) e ogni persona dovrebbe essere in grado di parlare con la tecnologia intorno a sé come farebbe con un'altra persona, e questo include parlare nella propria lingua madre.

Di recente, abbiamo annunciato la disponibilità di Houndify in 22 lingue, che rappresentano la maggior parte delle lingue più popolari al mondo. Man mano che continuiamo ad aggiungere più funzionalità e domini alla piattaforma AI vocale, amplieremo anche la nostra libreria di lingue, con l'obiettivo di raggiungere 100 lingue e varianti.

Oltre ad essere multilingue, Houndify è in grado di comprendere il linguaggio accentato e il parlato impreciso con un tasso di precisione molto elevato, a differenza della maggior parte delle altre piattaforme tecnologiche disponibili oggi.

I progressi nel campo dell'ASR e della NLP stanno procedendo a ritmi velocissimi: quali sono le prossime sfide da affrontare per migliorare la User Experience degli Assistenti Vocali?

AR: La piattaforma Houndify Voice AI ha risolto la sfida di combinare ASR e NLP in un unico processo e creare un'interfaccia di conversazione che capisca il modo in cui le persone parlano. Una delle sfide più grandi è educare i leader aziendali sul valore aziendale intrinseco di una soluzione di intelligenza artificiale vocale.

Recentemente abbiamo sponsorizzato un sondaggio globale di Opus Research che ha identificato le principali sfide per le aziende con una soluzione di assistente vocale nella loro roadmap, che ha rivelato i blocchi stradali per creare una strategia vocale.

Ecco le 3 sfide principali (in ordine):

  • Preoccupazioni per la sicurezza, la riservatezza dei dati, la fiducia dei consumatori e il rispetto delle leggi;
  • Incertezza generale sul ruolo / vantaggi della tecnologia vocale;
  • Incertezza sulla creazione di un assistente vocale personalizzato rispetto alla creazione di competenze per Alexa o azioni per Google.

Un assistente vocale personalizzato aiuta a superare una miriade di ostacoli per i marchi che cercano una soluzione di intelligenza artificiale vocale, inclusa la capacità di possedere i dati degli utenti e fornire controlli sulla privacy. 

E tu, che tipo di virtual assistant vuoi scegliere?

Come citato nell'intervista, il caso dell'automotive è solo uno dei tanti esempi di utilizzo di tali tecnologie. Extra Cube sta proseguendo questo progetto e non vede l'ora di applicare l'expertise guadagnato in altri settori. Contatta uno dei nostri esperti per saperne di più!

Cube-consulenza gratuita

Lascia un commento