Slide 1

Slide 1 text

6. September 2017 Was leisten Siri, Alexa, Cortana & Co.? Thomas Künneth, MATHEMA Software GmbH

Slide 2

Slide 2 text

Bei „Digitalen Assistenten“ denkt man an… Smartphone / Tablet Desktop Smartwatch

Slide 3

Slide 3 text

Demo

Slide 4

Slide 4 text

OK, dann eben auf Folie Siri (urspr. eigene Firma Siri Inc.; gegr. 2007) 2010 Kauf durch Apple Vorstellung Ende 2011 (iPhone 4s) Google Assistant (Vorgänger: Google Now) erstmals 2012 in Android-Geräten Z. B. auch im Messenger Allo und in der Google Lens Cortana erstmals präsentiert auf Microsoft-Konferenz Build 2014 Alexa Echo seit Juni 2015 in den USA, in Deutschland ca. 1 Jahr später

Slide 5

Slide 5 text

Gab‘s das nicht schon...? – Vorläufer und Wegbereiter Sprachsynthese (Text to speech) Spracherkennung (speech recognition) Sprachsteuerung während Telefonanrufen „Sagen Sie 1, um...“ „Was läuft heute Abend im Kino?“ (FränKi am IMMD5) Sprachsteuerung am Computer Diktieren von Dokumenten Steuern des Computers

Slide 6

Slide 6 text

Was ist neu? Oder... warum jetzt wieder? Rechner so leistungsfähig wie nie zuvor Größe und Masse so klein wie nie Systeme sind vernetzt – kabelgebunden und drahtlos Das Web bietet riesige Datenbasis und viele Dienste Das Web hat das Verknüpfen von Diensten vorgemacht (Mashups)

Slide 7

Slide 7 text

Kann in unterschiedlichsten Geräten verwendet werden Im Auto In TV-Geräten Im Web / in Messaging Apps

Slide 8

Slide 8 text

Neuester Schrei: Intelligente Lautsprecher Apple HomePod (Siri) Google Home (Google Assistant) Amazon Echo / Echo Dot (Alexa) Harman Kardon Invoke (Cortana) ...und es werden mehr...

Slide 9

Slide 9 text

Einsatzgebiete Auskünfte Medienwiedergabe Smart Home

Slide 10

Slide 10 text

Demo

Slide 11

Slide 11 text

Wie funktionieren Assistenten? Mikrofone nehmen Datenstrom auf (in sprachgesteuerten Lautsprechern mehrere Richtmikrofone) wird idealerweise durch Hardware komprimiert einen Server geschickt und dort verarbeitet Ausgabe der Information erfolgt je nach Medium... als gesprochene Sprache als multimedial angereicherter Text Dienstintegration weitgehend über Backend Ausnahme: direktes Ansprechen lokaler Geräte z. B. über Bluetooth

Slide 12

Slide 12 text

Konsequenzen Ausschl. offline funktionierende Assistenten wird es nicht geben Assistenten funktionieren am besten, wenn sie immer mithören Der Datenstrom wird „irgendwo“ verarbeitet Durch Integration weiterer Dienste werden „noch mehr“ Daten ausgetauscht

Slide 13

Slide 13 text

Demo

Slide 14

Slide 14 text

Wieviel Intelligenz ist „drin“? Hersteller werben mit den typischen Buzzwords… Deep learning Machine learning Künstliche Intelligenz Innenleben nur bedingt einsehbar, z. B. durch Blick auf Programmierschnittstellen Deshalb kann man spekulieren: eigentliche Spracherkennung so wenig wie möglich Intelligenz am ehesten in der Aggregation der Informationen (Stichwort: Google Knowledge Graph)

Slide 15

Slide 15 text

Assistenten erweitern Assistenten leben von der Integration bestehender Dienste Google beispielsweise kennt App-basierte Aktionen Alexa Skills werden „serverless“ implementiert Laufen also sehr wohl in der Cloud Sind aber als kleine Einheiten konzipiert Vor allem Amazon wirbt derzeit sehr intensiv um Entwickler, z. B. durch Giveaways

Slide 16

Slide 16 text

Interaktion mit dem Assistenten funktioniert… … nicht durch echtes Gewöhnen des Assistenten an den User, sondern … Lernen der verstandenen Kommandos durch den Nutzer Amazon und Google verschicken Mails mit den neuesten Kommandos …apropos E-Mail…

Slide 17

Slide 17 text

Demo

Slide 18

Slide 18 text

Dienstintegration und Interaktionsfluss Arbeit mit Assistenten macht Spaß, wenn ein Interaktionsfluss entsteht Dazu müssen sich die Assistenten den Aktionsverlauf merken Zudem müssen möglichst viele Dienste integriert sein

Slide 19

Slide 19 text

Alexa Companion App Hilft bei der Konfiguration Stellt Funktionen bereit, die Echo nicht direkt ausführen kann

Slide 20

Slide 20 text

Samsung Bixby Auf S8 „Push to talk“ Oder „Hi Bixby“ Einführung mit großer Verspätung Kann nur Koreanisch und englisch

Slide 21

Slide 21 text

Walkthrough Setup

Slide 22

Slide 22 text

Demo

Slide 23

Slide 23 text

Kurioses Burger King kapert Google Home Microsoft und Amazon wollen kooperieren, um ihre beiden Assistenten zu koppeln Können/dürfen Sprachmitschnitte in Gerichtsverfahren verwendet werden?

Slide 24

Slide 24 text

Fazit Für Hersteller sichert die Hardware idealerweise die Nutzerbindung an eigene Dienste Hardware: für Musik leistungsfähig genug, um bestehende Komponenten zu ersetzen? Welche Assistenten integrieren welche Fremddienste (zum Beispiel Smart Home-Protokolle)? Alle Assistenten sind an ein Ökosystem gebunden Die Wahl des Assistenten dürfte letztlich von den genutzten Diensten abhängen ...und die Vielfalt der Fragen, die er beantworten kann

Slide 25

Slide 25 text

In Zukunft mehr Intelligenz der Assistenten durch Machine Learning? Wo sind die Grenzen? "Hey Siri, wie heißt das Gebäude vor mir?„ "Wo befinde ich mich?„ Welche Fragen gestellt werden, hängt von der Ausprägung des Assistenten ab. Steht er in der Wohnung, wird er zur Steuerung von Smart Home Komponenten, Entertainment Systemen und ähnliches eingesetzt Bei dem Echo Dot kann man die Mikrofone abschalten. Die Frage ist aber, wie weit man seine Paranoia treiben will - sind sie wirklich aus?

Slide 26

Slide 26 text

Vielen Dank thomas.kuenneth@mathema.de @tkuenneth