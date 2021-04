Von Jürg Schleier*

Wieso Spracherkennung?

Die einfache Antwort: Weil Tippen für den Menschen unnatürlich ist! Die meisten von uns – zumindest die, die vor der Jahrtausendwende geboren wurden – mussten mühsam lernen, dass die primäre Mensch-Maschinen-Interaktion über eine Tastatur führt. Und wenn man diese Interaktion schnell und elegant ausführen wollte, dann musste man das 10-Finger-System erlernen. Maus und Touchscreen haben eine gewisse Erleichterung gebracht, aber ganz abgelöst wurde die Mühsal des Maschinenschreibens nicht. Und sind wir ehrlich: für viele ist es schon schwierig genug klare Gedanken und Worte zu fassen. Das Ganze dann auch noch in der richtigen Syntax in die Tasten zu hauen, stellt dann eine oftmals kaum überwindbare Hürde dar. Die „Erlösung“ heisst auf Neudeutsch «Natural Language Processing – NLP und bezeichnet die maschinelle Erkennung der natürlich gesprochenen Sprache. Diese ist bereits heute auf einem derartigen Niveau, dass in vielen Bereichen die Verwendung der Tastatur weitestgehend abgelöst werden kann. Es dürfte noch einige Zeit verstreichen, bis die Tastatur aus den Mainstream Anwendungen verschwunden ist. Aber wir sind schon eine gute Distanz des Weges gegangen. Die noch zurückzulegende Distanz hat aber mehr mit der Trägheit des Menschen und der weiten Verbreitung der Tastatur zu tun, als mit Reife der Alternative «Spracherkennung». Meine Prognose: Wenn die Generation Ipad, Siri und Whatsapp in der Zukunft die Führungspositionen übernommen hat, dann wird die Tastatur ganz in der Exoten-Ecke verschwinden.

Die grossen Player machen es vor. Wer die Schnittstelle zu den Kunden besitzt, der bestimmt was dahinter passiert. Hier haben Google mit der Suchmaschine, Apple mit dem Appstore und Amazon mit Alexa bereits vorgemacht, was das bedeuten kann. Mit der Spracheingabe werden jetzt die Karten bei der Kundenschnittstelle nochmals neu gemischt, und die grossen Player versuchen sich in Position zu bringen. Apple hat mit Siri bereits gut vorgelegt, Amazon hat mit Alexa einen schlauen Move gemacht und Google bietet eine ganze Palette toller Spracherkennungs-Produkte an. Aber wo ist Microsoft? Die meisten Leute wissen nicht mal, wie man Cortana schreibt und die aktiven Nutzer von Cortana, auch bei der eigenen MSFT Kundenbasis, wird wohl unter 1% liegen. Jetzt ist es an der Zeit, einen grossen Schritt nach vorne zu machen und Microsoft hat mit Nuance, den grössten verfügbaren Sprachlösungs-Anbieter Nuance gekauft!

In vielen Artikeln werden jetzt die Stärken und die Kundenbasis von Nuance im Health- und Medical-Segment und die damit verbunden Synergien als Hauptnutzen der Akquisition hervorgehoben. Das mag wohl ein überzeugender Zusatznutzen sein. Nuance bietet aber viel mehr! Nuance entwickelt und betreibt mit 6’000 Mitarbeitenden seit über 20 Jahren Spracherkennungslösungen im Enterprise Bereich, unterstützt viele unterschiedliche Sprachen und weiss, wie man Voice in den Business-Prozess der Unternehmen integriert. Jetzt bekommt das Mauerblümchen Cortana eine Monsterpackung Industrie-Dünger.

Blick in die Glaskugel

Der Analyst Gartner hat im Dezember 2020 prognostiziert, dass uns im Bereich «Conversational AI» eine riesige Akquisitionswelle und massive Veränderungen bevorstehen. Gartner hat die Entwicklung in diesem Bereich mit den Entdeckungen von Kopernikus im 15. Jahrhundert verglichen, der bekanntlich postuliert hat, dass die Sonne und nicht die Erde der Mittelpunkt unseres Sonnensystems ist. Die US-Amerikaner haben ja eine bekannte Neigung zur bildhaften Übertreibung. Aber jeder der das Umfeld beobachtet sieht, dass grosse Veränderungen in der Mensch-Maschinen-Schnittstelle auf uns zukommen.

Was bedeutet diese «Monster-Akquisition» für einen Schweizer Sprachlösungs-Anbieter, wie Spitch?

Es kommt zu Verwerfungen im Markt, was für einen kleinen Anbieter wie Spitch immer eine Chance sein kann. In der Schweiz spielt Nuance aktuell keine Rolle mehr, nachdem sie sich 2017 (aus Mangel an Schweizerdeutschkenntnissen) aus dem Schweizer Mark zurückgezogen haben. Hier erwarte ich kurz- und mittelfristig keine Veränderungen. In Deutschland dagegen, aber auch weltweit hat MSFT jetzt unseren Hauptkonkurrenten aus dem Markt genommen. Erfahrungsgemäss resultieren solche Grossübernahmen immer zuerst in einer Lethargie und Orientierungslosigkeit, bevor der Synergie-Effekt eintrifft. Dies ist aus der persönlichen Erfahrung mit zwei grossen Oracle Akquisitionen gesprochen.

Für Spitch ist es jetzt wichtig, dieses Vakuum, das vorerst entsteht, flexibel und innovativ abzudecken, bevor sich MSFT mit der Nuance-Lösung richtig stabilisiert hat. Zudem lassen die «Big Player» oftmals Märkte und/oder Bereiche unbearbeitet, die für sie grössen- und ertragsmässig nicht interessant sind.

Ich sehe diese Übernahme als grosse Chance, uns als Schweizer Sprachlösungsanbieter für die Zukunft ganz neu und schlagkräftig zu positionieren!

* Jürg Schleier ist seit 5 Jahren Country Manager DACH beim Schweizer Sprachlösungsanbieter Spitch.