Springe direkt zu Inhalt

„Und nun sprechen Sie der KI bitte nach …“

Was macht eine Geisteswissenschaftlerin in einem Start-up-Accelerator für Künstliche Intelligenz ? Dr. Vera Scholvin gehört mit Dr. Paras Mehta und Yamile Vargas zum Führungsteam von„sylby“, deren App KI zur Unterstützung beim Spracherwerb nutzt.

26.05.2023

Das Team von „sylby“: Dr. Vera Scholvin, Yamile Vargas und Dr. Paras Mehta.

Das Team von „sylby“: Dr. Vera Scholvin, Yamile Vargas und Dr. Paras Mehta.
Bildquelle: Miriam Klingl

Eigentlich ist Dr. Vera Scholvin Geisteswissenschaftlerin, Linguistin, um genau zu sein. Ihre Doktorarbeit handelt von französischen Lehnwörtern im Vietnamesischen, von deren Aussprache und davon, nach welchen Gesetzmäßigkeiten und Mustern sich das sprachliche Eingemeinden von „fromage“ und „gare“ und „valise“ in die vietnamesische Sprache vollzieht.

Doch jetzt gerade sitzt Scholvin in einem Accelerator für Start-ups auf dem Feld der KI – einer Art Katalysator für Gründer. Das ganze gläserne Gebäude in Berlin-Gesundbrunnen sieht so aus, als hätte man für einen Film eine Kulisse aufgebaut, die aus jeder Faser „Start-up-Kultur“ und „Innovation“ atmen soll. Alles blitzt, blinkt und spiegelt, und Scholvin lädt zum Interview in zwei von der Decke hängende Polstersessel, die zwischen Besprechungskabinen und Sitzecken für Team-Meetings baumeln. In der Kantine bereitet ein Roboter das Essen zu. Er steht wie ein überdimensionierter Getränkeautomat inmitten grüner Topfpflanzen, Tischtennisplatten und noch mehr gepolsterter Sitzecken für Team-Besprechungen und Brainstorming-Sessions oder Meetups mit Risikokapitalgebern.

Dazwischen sitzen junge Menschen aus aller Welt in gläsernen Büros vor ihren Laptops und versuchen, das nächste große Ding zu lancieren. Der Accelerator, der Start-ups in ihrer Entwicklung beschleunigen will, befindet sich im „Merantix AI Campus Berlin“. „AI“ wie Artificial Intelligence: Alles hier ist darauf ausgerichtet, Projekte zu entwickeln, in denen KI möglichst wirkmächtige und sinnvolle Anwendung findet. So wie „­sylby“, das Start-up, das Scholvin zusammen mit Dr. Paras Mehta vor einem Jahr aus der Taufe gehoben hat.

Unterstützung durch das Entrepreneurship-Netzwerk „NFUSION“

Kennengelernt haben Scholvin und Mehta sich über „NFUSION“, das Entrepreneurship-Netzwerk der Freien Universität, das als Teil der Ernst-Reuter-Gesellschaft eine Community von Entrepreneuren aus allen Gründungs- und Unternehmensphasen ist. Mehta kommt eigentlich aus Neu-Delhi, er hat an der Freien Universität in Informatik promoviert und danach ein Healthcare-Start-up gegründet. Dazwischen arbeitete er als Softwareentwickler für ein VW-Tochter-Unternehmen. Doch erst als er Scholvin traf, entstand die Idee für „sylby“: eine App für KI-unterstütztes Sprachtraining, die vor allem darauf abzielt, die Aussprache zu verbessern. Und die das gezielt machen kann, weil sie besonders darauf eingeht, welche Laute für Italienisch- oder Chinesisch- oder Hindi-Sprechende im Deutschen schwierig sind.

Ursprünglich wollten die beiden ein anderes Problem lösen. Scholvin erzählt von der Beobachtung in ihrem privaten Umfeld, wie die Spracherkennung in einem Navigationsgerät daran scheiterte, Menschen mit starkem Akzent zu verstehen. „Sie werden von Siri oder einem Navi einfach nicht verstanden, wenn ihre Aussprache vom deutschen Standard deutlich abweicht“, sagt Scholvin. Also wollte sie zusammen mit Mehta Methoden entwickeln, mit denen sich Spracherkennungsprogramme so verbessern lassen, dass sie auch Menschen mit starkem Akzent verstehen.

Das Aussprachetraining wird oft vernachlässigt

Doch als die beiden begannen, dafür potentielle User, also Nicht-Muttersprachler, zu interviewen, merkten sie: Diese wollten nicht nur von Maschinen besser verstanden werden, sondern ganz allgemein und von allen! Denn Schwierigkeiten mit der Aussprache können für manche Menschen ein echtes Hindernis in ihrem Alltag und Berufsleben sein; das reicht von einfachen Schwierigkeiten, sich verständlich zu machen, über das Gefühl, nicht ernst genommen zu werden, bis hin zu Abwertungs- und Diskriminierungserfahrungen. Das Problem dabei: Selbst wenn jemand dann einen Sprachkurs belegt, wird das Aussprachetraining oft vernachlässigt. Eigentlich bräuchte man dafür ein logopädisch unterfüttertes Einzeltraining und nicht bloß ein „Sprechen Sie mir nach …“, bei dem die eigenen Laute im kollektiven Singsang der ganzen Klasse untergehen. Scholvin und Mehta merkten also: Unsere Ursprungsidee ist nicht das, was die Leute sich am meisten wünschen, aber für eine kleine Abwandlung derselben Sache gäbe es durchaus Bedarf. In beiden Fällen geht es ja um computergestützte Sprachverarbeitung, also jenen Bereich, in dem sich die Expertisen des Softwareentwicklers Mehta und der Linguistin Scholvin treffen. Nur entwickelten die beiden jetzt eben eine App, die die User gezielt dabei unterstützt, an ihrer Aussprache zu arbeiten, sie etwa trainiert, jene Laute zu bilden, die in ihren Muttersprachen nicht vorkommen und deshalb besonders ungeübt und schwierig für sie sind.

Die App „sylby“ wird Menschen helfen, die Schwierigkeiten mit der Aussprache haben und dadurch im Alltag oder im Berufsleben auf Probleme stoßen.

Die App „sylby“ wird Menschen helfen, die Schwierigkeiten mit der Aussprache haben und dadurch im Alltag oder im Berufsleben auf Probleme stoßen.
Bildquelle: Miriam Klingl

Der rasante Fortschritt der KI

Doch was bedeutet eigentlich KI im Fall von „sylby“? Mehta erklärt es so: „Künstliche Intelligenz meint hier ein Deep-Learning-Modell, das spezifisch darauf trainiert wird, in Audiodaten Fehler in der Aussprache zu erkennen und zu identifizieren.“ Um das KI-Modell zu trainieren, hat Mehta es mit bereits vorliegenden und eigens dafür gesammelten Datensätzen gefüttert und trainiert. KI heißt also: Man muss nicht in Millionen Zeilen Codes vordefinieren, welche Laute nahe genug an der Standardaussprache sind, um verstanden zu werden. Sondern das Modell lernt das, wenn es trainiert. Mehta sagt: „Wir kommen damit zum richtigen Zeitpunkt und profitieren so von den rasanten Fortschritten auf dem Gebiet der KI. Vor fünf Jahren wäre das, was wir heute machen, technisch wohl noch nicht möglich gewesen. Die Genauigkeit der Modelle ist heute einfach viel höher.“

Scholvin und Mehta wurden zuerst durch „Profund Innovation“, den Start-up-Inkubator der Freien Universität gefördert. Danach konnten sie dank eines EXIST-Gründungsstipendiums, mit dem das Bundeswirtschaftsministerium Ausgründungen aus Universitäten fördert, ein Jahr lang an ihrer App arbeiten, bevor sie „sylby“ im Januar 2023 offiziell auf den Markt brachten. Das ist selbst für Start-ups ein rasantes Tempo. Anfang 2023 stieß dann Yamile Vargas als dritte Führungskraft zu „sylby“; sie kümmert sich vor allem um Marketing und Business Development. Denn ein Start-up soll wachsen, darum geht es ja auch im Accelerator in Berlin-Gesundbrunnen. Bis jetzt hat das Unternehmen zwei erste Investoren. Aber wenn man schnell größer werden will, wäre weiteres Investitionskapital hilfreich, denn die Konkurrenz schläft ja bekanntlich nicht. „sylby“ gibt es bis jetzt nur für Deutsch, das Team plant aber bereits, das Angebot in den nächsten Monaten auf weitere Sprachen zu erweitern.

Wie fühlt sich das an, als Linguistin nun Gründerin eines erfolgreichen Start-ups zu sein? Scholvin hatte im Jahr 2018 noch als Studentin während ihres Masterstudiums an der Freien Universität dem Online-Studienfachwahl-Assistenten der Freien Universität ein Interview gegeben, in dem sie Studienanfängerinnen und -anfänger über ihre Erfahrungen informierte. Damals sprach sie von einem Rechtfertigungsdruck für ihre Studienwahl als Sprachwissenschaftlerin, und dass sie anfangs keine Antwort parat gehabt hatte, wenn sie gefragt wurde, was sie denn „später Ordentliches damit werden könnte“. Der schnelle Erfolg des Start-ups freut die Linguistin Vera Scholvin auch deshalb besonders. Nun lässt sich sogar in Euro ablesen, was ihre Arbeit wert ist.