Es würde wohl kaum jemand so schnell vermuten, dass zwischen dem ehemaligen Baywatch-Star David Hasselhoff und einem deutschen Audio Intelligence-Unternehmen eine nachvollziehbare Verbindung besteht. Glaubt man Dagmar Schuller, Mitgründern des Startups audEERING gibt es diese allerdings schon. Dabei geht es aber weniger um die Strände Malibus als vielmehr um Hasselhoff intelligentes Auto K.I.T.T. aus der Serie Knight Rider. Björn Schuller, der mittlerweile CSO des Unternehmens ist, entwickelte nämlich als Teenager bereits den Wunsch eines Tages auch ein Auto zu besitzen, mit dem er sich unterhalten kann. Dass er eines Tages namhafte Unternehmen wie BMW mit der dafür notwendigen Technologie ausstatten würde, daran dachte er damals aber bestimmt noch nicht. Erstmal wurde er Universitätsprofessor und setzte sich auf wissenschaftlicher Ebene mit intelligenter Audioanalyse und künstlicher Intelligenz auseinander. Das Start-up Audeering, das im Jahr 2012 offiziell gegründet wurde, ist jedoch nicht nur aus seinen Forschungsarbeiten entstanden, sondern aus der Arbeit mehrerer ForscherInnen, die zu dieser Zeit an der TU München tätig waren. Mittlerweile gilt das Münchner Start-up als europaweit führender Innovationstreiber im Bereich der intelligenten Audioanalyse und emojionaler künstlicher Intelligenz. Doch was bedeutet das eigentlich?

sensAI und openSMILE

Im Vergleich zu ähnlichen Systemen möchte audEERing nicht nur verstehen und analysieren was jemand sagt, sondern auch auswerten können, wie jemand etwas sagt. Es geht um das bekannte „Zwischen den Zeilen lesen“, also um das Erkennen von Emotionen – dadurch versteht das System um ein Vielfaches mehr. Das kann vor allem im medizinischen Bereich von Vorteil sein, wenn es darum geht Krankheiten früher zu erkennen. auDEERING macht es aber auch möglich, dass sich bestimmte Geräte einer Person und damit auch seiner oder ihrer momentanen Stimmungslage anpassen. Das Konzept des Startups ist seit seiner Gründung gleich geblieben: Ziel ist es bestimmte Fokusindustrien, wie die Automobilindustrie, die Telekommunikation und den Gesundheits- und Wellnessbereich mit Technologien zu versorgen, die es möglich machen komplexe Audiosequenzen zu analysieren und damit bei wichtigen Entscheidungen zu helfen. Die sensAI Technologie des Start-ups ist der Schlüsselfaktor dieses Prozesses – sie entschlüsselt Sprachsignale und zieht hinsichtlich des Zustands des Sprechers bestimmte Erkenntnisse. Die Technologie stellt dabei nicht nur charakteristische Eigenschaften wie Alter, Geschlecht und Persönlichkeit fest, sondern auch Depression, besonderes Interesse oder Trunkenheit. Diesen Möglichkeiten liegen Deep Learning-Methoden zugrunde sowie der eigens entwickelte Toolkit openSMILE. Letztere ist eine quelloffene Software, die Informatik, Psychologie und Kognitionswissenschaft miteinander verbindet. Dahinter steckt ganz klar die Überzeugung dass emphatische Assistenten, KI und intelligente Audioanalyse ein ganz wesentlicher Teil unserer Zukunft sein werden.

©Pixabay

Überall dabei

Mittlerweile hat das Münchner Start-up schon mehrere Produkte auf den Markt gebracht. Dazu zählt auch das Audiotagebuch Audiary. Der Bereich in dem es zum Einsatz kommen soll, ist jener der klinischen Stimmanalyse. Das Tagebuch soll in erster Linie dabei helfen psychische Störungen zu diagnostizieren. Callyser ist ein Produkt, das in einem ganz anderen Segment angesiedelt ist – es soll bei der Arbeit im Call-Center bei der Analyse von Telefongesprächen zwischen Mitarbeitern und Kunden eine wichtige Rolle übernehmen. Dabei analysiert Callyser die Aufnahmen auf mehreren verschiedenen Ebenen – der Redeanteil von Mitarbeiter und Anrufer wird analysiert, ebenso die dominierende Atmosphäre während des Telefonats und die Stimmung der Sprecher, die während des Telefonats vorherrscht. So können Eskalationen frühzeitig erkannt werden und dadurch einem erfahrenen Call-Center-Mitarbeiter rechtzeitig mitgeteilt werden, sobald sich eine Situation in Richtung eines gefährlichen Anspannungsbereiches bewegt. Diese kann dann noch vor der Eskalation entschärft und beruhigt werden. Auch DJs profitieren vom Forschergeist des Teams – sensAI-Music ist eine Software und App die smart genug ist einzelne Elemente eines Songs, wie etwa Tempo, Melodie oder Gesang, zu erkennen. Davon ausgehend berechnet es dann die emotionale Einstellung des Stücks. Damit können also umfangreiche Musikdatenbanken ausgewertet und so Playlists zusammengestellt werden, die optimal aufeinander abgestimmt sind.

Der Mensch im Vordergrund

Die Grundmotivation des vierköpfigen Kernteams besteht in ihrem ständigen Innovationsstreben: „Trends setzen, statt ihnen zu folgen“ lautet deshalb das Credo. Der gemeinsame Forschungshintergrund der begeisterten Tüftler sorgt dafür, dass dieser Antrieb ständig erhalten bleibt. In der Prävention von Krankheiten wie Alzheimer, Parkinson oder Depression etwas bewirken zu können, funktioniert als zusätzlicher Motivationsfaktor. Obwohl aktuelle Bedürfnisse des Marktes dabei nicht aus den Augen verloren werden dürfen, steht bei Schuller und seinem Team deshalb immer der Mensch im Vordergrund. Ein Zugang der sich lohnt, denn angefangen haben die begeisterten Tüftler erst vor wenigen Jahren mit einem Startkapital von nur 7500 Euro und ganz ohne externe Finanzierung. Zwischen 2013 und 2017 konnte der Umsatz aber immer im dreistelligen Bereich gesteigert werden, sodass ein zweiter Standort in Berlin eröffnet werden konnte und mittlerweile 24 „audEERS“ an der gemeinsamen Vision mitarbeiten.