Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Voice UI: a little more conversation, a little more action

Gaia Vicamini
October 15, 2018

Voice UI: a little more conversation, a little more action

This presentation gives an introduction to Voice UI and the most common vocal assistants. I will show what are voice interfaces and what is the process to design them, as well as sharing some best practices learnt designing Musement's app for Google Assistant.

Gaia Vicamini

October 15, 2018
Tweet

Other Decks in Design

Transcript

  1. Actions on Google & Virtual Assistants - GDG Venezia Padova,

    15 Ottobre 2018 Voice UI: a little more conversation, a little more action
  2. Gaia Vicamini UX Designer @ Musement In Musement seguo il

    processo di user experience design dalla fase di ricerca alla fase di testing e validazione con gli utenti su più touchpoint e nell’ultimo anno mi sono occupata verticalmente di interfacce conversazionali. Fotografare paesaggi meravigliosi in compagnia della mia giacca gialla è la mia seconda passione. [email protected]
  3. Voice User Interface Si definisce interfaccia vocale (Voice User Interface

    - VUI) un’interfaccia che permette di interagire con il sistema tramite l’utilizzo della voce. Il vantaggio principale è permettere l’interazione anche quando l’attenzione dell’utente è concentrata altrove.
  4. I recenti progressi in Machine Learning e NLP hanno accelerato

    lo sviluppo dell’interazione vocale, studiata già dagli anni ’50. Eredità del passato
  5. ✓ Traffico Opportunità La conversazione può rimandare al sito per

    più informazioni o terminare un acquisto Le interfacce vocali replicano le normali dinamiche di conversazione. In questo modo si crea una connessione semplice e genuina con l’utente. ✓ Retention Sapendo il contesto e il profilo di chi sta parlando si possono offrirne risultati più accurati. È interessante anche per “promuovere” alcune risposte. ✓ Personalizzazione
  6. Statistiche Entro il 2020 il 30% di tutte le ricerche

    online avverrà senza uno schermo (Gartner) Tra i possessori di Google Home e Amazon Echo il 22% effettua acquisti attraverso l’interazione vocale (Forbes) Le vendite di Smart Speakers sono quasi triplicate da Aprile a Giugno 2018, passando da 5,8 a 16,8 milioni di device (Ansa)
  7. 30k Utenti attivi 3 min Durata media conversazione 19k Conversazioni

    mensili Dati di utilizzo Musement: Google Assistant
  8. Voice UI Design: tra brand e tecnologia • È necessario

    progettare delle interfacce vocali consistenti nell’ecosistema dei diversi smart speaker • L’aspetto più importante è la caratterizzazione del personaggio che darà voce al brand
  9. Donare la propria voce per creare un dataset ampio ed

    utilizzabile da tutti: 
 
 https://voice.mozilla.org/en/new Open source voice technology What’s next?
  10. Arrivare ad avere vere e proprie conversazioni e non solo

    semplici comandi. Per esempio: Google Duplex e Microsoft Xiaoice. Conversazioni e AI What’s next?
  11. Gli assistenti vocali potranno essere utilizzati anche in contesti lavorativi

    per aiutare la produttività e la gestione di alcune attività. Amazon ha già rilasciato Alexa for Business. Business What’s next?
  12. Siamo creature sociali, conversare è un’abilità che tutti imparano fin

    da piccoli. Le interfacce vocali permettono di raggiungere quasi chiunque, riducendo il digital divide: • Anziani • Persone con difficoltà a leggere e scrivere • Utenti con problemi alla vista • Bambini Digital divide What’s next?
  13. User personas Sono personaggi narrativi il cui profilo riassume le

    caratteristiche di un gruppo di utenti esistente. Sono costruite sulla base dell’osservazione diretta di utenti reali per identificarne il profilo, i bisogni, le richieste e le aspettative in modo da progettare la migliore esperienza per loro.
  14. Bisogna controllare che le personas siano valide anche per gli

    assistenti vocali. 
 È possibile che cambino o si aggiungano, con queste tecnologie si possono raggiungere persone diverse. Nuove personas User personas
  15. System personas Per system persona si intende una descrizione o

    rappresentazione dell’assistente, simile a quella creata per le user personas. Servono a creare la personalità del personaggio che darà la voce al brand.
  16. Un’interfaccia vocale verrà percepita come una persona che rappresenta il

    brand. 
 È tipico del comportamento umano antropomorfizzare un sistema: le persone tendono a trattare i computer e le interfacce vocali come delle persone. Perché crearle? System personas
  17. È fondamentale includere anche esempi del modo di parlare del

    nostro personaggio. Cosa direbbe il personaggio? System personas
  18. Job Tour guide Description
 Musement is a companion, a trusted

    advisor and a mate/pal. It’s an expert on travel itineraries, local culture and hidden gems. It helps you enjoy a destination like locals do. Even though it knows a lot about travel, it’s friendly and doesn’t judge people based on their culture level. Quotes «Ah, Rome! Got it. You should definitely visit the Colosseum, Vatican Museums and St. Peter’s Basilica. Would you like to know more attractions or look for a restaurant now?» «Okay, what about looking for something to visit in town?» Musement is a super expert but friendly travel companion. It is easy going, smart, witty and savvy.
  19. Placeonas Il termine placeonas si riferisce ai vari ambienti o

    contesti in cui l’utente potrebbe interagire con il nostro servizio. 
 Ci aiuta a considerare quale sia l’interfaccia migliore da utilizzare. Esempio: multimodale, vocale, grafica… non deve essere per forza vocale!
  20. Placeona (contesto) Mani Occhi Orecchie Bocca In biblioteca, indossando le

    cuffie Mani libere Occhi liberi Orecchie libere Non può parlare Cucinando Mani sporche Occhi liberi Orecchie libere Voce disponibile Nightclub Mani libere Occhi liberi Orecchie occupate (musica alta) Non riesce a parlare (musica alta) Guidando Mani occupate Occhi occupati Orecchie libere Voce disponibile da Des Traynor, Intercom
  21. User stories Sono brevi e semplici descrizioni di funzionalità viste

    dal punto di vista dell’utente. • As a person planning a holiday, I want to have travel tips, best places to visit and local hidden gems all in one place without reading many different blogs, guides and websites, so I can save time. • As a person travelling to another country, I want to know which are the best places to eat local food, so I can enjoy my holiday without losing time looking for a good restaurant online. • As a person who planned a trip to Rome, I want to buy tickets for the Vatican Museums, so I don’t have to queue when I get there (next steps)
  22. Partendo dalle user stories, bisogna identificare cosa si può realizzare

    realisticamente, oltre alle funzionalità più utili. Funzionalità User stories
  23. Cosa posso fare oggi a Milano? - User: Hey Google,

    passami Musement - Google: Certo, ecco Musement - Musement: Ciao! Posso aiutarti? - User: Cosa posso fare oggi? - Musement: Che città ti interessa? - User: Sono a Milano - Musement: Ok, fammi pensare. Ci sono un paio di mostre molto interessanti e un evento al Blue Note. Che ne dici? - User: Quali mostre? - Musement TTS: Le più visitate sono Toulouse-Lautrec e Caravaggio. Quale preferisci? - Musement APP: Le più visitate sono Toulouse-Lautrec e Caravaggio. Quale preferisci? - show cards - User: No, non mi interessano. Qual era l’evento al blue note invece? - Musement TTS: Stasera al Blue Note suonano gli Italian Dire Straits, una tribute band. Che ne dici? Conversazioni di esempio Servono a capire come l’utente interagirà con il sistema e creano una documentazione delle fondamenta dell’interazione che stiamo progettando. Di solito ogni conversazione si focalizza su un intent, ma possono diventare più complesse.
  24. Flows Servono a rappresentare il flusso della conversazione collegando ogni

    intent e casistica, mostrando la logica dell’interfaccia vocale. È importante prevedere sia “happy path” che “unhappy path”.
  25. Script Lo script serve a raccogliere tutte le frasi che

    verranno lette dall’assistente o pronunciate dall’utente. Insieme ai flussi è la documentazione più esaustiva dell’esperienza.
  26. Per validarli si può organizzare una table read: si legge

    il dialogo ad alta voce insieme ad un’altra persona, come se fosse uno user test. Può aiutare a identificare espressioni che funzionano in forma scritta ma non a voce, prima di sviluppare un prototipo. Come validarli Script
  27. User Test Gli user test servono per validare l’usabilità dell’interfaccia

    vocale.
 • Table read
 • WOz: una persona fa finta di essere il sistema. Invece di avere un prototipo funzionante, il mago aziona le risposte pre- registrate e le fa sentire all’utente. 
 Il limite è che non ci saranno errori.
 • Prototipo funzionante

  28. Nel caso delle VUI non si può chiedere all’utente di

    pensare ad alta voce. È bene organizzare il test in tanti piccoli task, ognuno con il suo scenario, per poi fare domande sull’esperienza, problemi, difficoltà, osservazioni, etc… Testare interfacce vocali User Test
  29. Bisogna scrivere sempre stringhe che suonino bene anche lette ad

    alta voce. Non sempre quello che funziona per un’interfaccia grafica tradizionale funziona anche in una conversazione. #1 Rileggere ad alta voce Best practices
  30. L’intervallo di attenzione è brevissimo, bisogna tentare di essere più

    sintetici possibili. #2 Sinteticità Best practices
  31. Se previsto dalla system persona, via libera all’uso di contrazioni

    e espressioni tipiche del parlato, aiuteranno la conversazione a sembrare più naturale e realistica. #3 "Parla come mangi" Best practices Esempio: innanzitutto, ok, poi, vediamo, fammi pensare, don’t e won’t invece di do not e will not
  32. Generalmente è meglio chiedere come proseguire, fare la domanda, o

    richiedere come proseguire alla fine della frase. #4 Azione alla fine Best practices
  33. Sono l’equivalente delle icone per quanto riguarda le interfacce visive.

    Servono a comunicare delle informazioni senza che debbano essere lette. #5 Earcons Best practices
  34. Nelle interfacce vocali non funziona avere equivalenti di popup, pubblicità

    e simili. Non bisogna distogliere l’attenzione dell’utente dal motivo per cui ha iniziato la conversazione. #6 Non distogliere l’attenzione Best practices
  35. Come quelli visivi, servono ad indicare all’utente che il sistema

    ha capito e che sta elaborando la richiesta. Bisogna includerli anche nelle conversazioni. #7 Feedback Best practices Sono presenti anche nelle interazioni quotidiane, per esempio durante le conversazioni con una persona (silenzi, espressione, atteggiamento…).