Warum nicht, wenn alle mitreden dürfen! Für das Common Voice Projekt von Mozilla sammelt Kelly Davis die größtmögliche Vielfalt an Stimmen, damit in Zukunft jeder mit Computern sprechen kann und auch verstanden wird, unabhängig von seiner Herkunft. Doch was braucht die Zukunft der Spracherkennung, um eine gute zu werden? Muss Innovation bedeuten, dass wir auf Dinge verzichten, die wir früher geschätzt haben?
Es gibt nicht viele Menschen, die die Gabe haben, Jahrzehnte weit vorausschauen zu können. Lange bevor sich Siri unaufgefordert aus dem Handy in Gespräche einmischte oder sich Amazons Alexa über den Echo-Lautsprecher in unsere Wohnzimmer lauschte, hatte Kelly Davis, Manager der Machine Learning Group von Mozilla, eine klare Vision davon, wie wir mit Computern mithilfe von Spracherkennungssoftware so sprechen könnten, dass es für alle Menschen eine wirkliche Bereicherung wäre.
Wir treffen Kelly am Teehaus im Englischen Garten, einem seiner Lieblingsorte in Berlin. Und ein Ort großer Geschichte. Das Teehaus steht auf dem Fundament des ehemaligen Wohnhauses der deutschen Theaterlegende Gustav Gründgens. 1952 gebaut, zur Einweihung des Englischen Gartens, der eine Hommage an die britisch-deutsche Zusammenarbeit während der Berlin Blockade war. Es ist noch früh am Morgen, das Teehaus noch geschlossen, ein weicher Dunst liegt über der Blumenpracht, die sich in üppig-präziser Eleganz in abgezirkelte Beete ordnet, wie es sich für einen Englischen Garten gehört.
Es gibt noch ein paar schöne Beständigkeiten, die Kelly schätzt. Und die ihn in seinem Leben begleiten, indem er oft mehr Zeit damit verbringt an einer Zukunft zu arbeiten, die allen Menschen gerecht wird, als in seinem eigenen Jetzt.
Sein Zwanziger-Jahre-Outfit – Schiebermütze, Hosenträger, polierte Spectator Schuhe – Kellys Markenzeichen, gehört auch dazu. Kelly sagt: “Das ist ein Stil, der zu mir passt. Er gefällt mir einfach!” Die Freiheit zu sein, wer man ist. Dass jeder Mensch dieses Recht auf Teilhabe, Vielfalt und Chancen hat, das steht für Kelly im Zentrum seiner Arbeit.
Das Projekt Common Voice, an dem Kelly mit seinem Team bei Mozilla und vielen Freiwilligen arbeitet, tritt an, die Spielregeln für die Zukunft der Spracherkennung neu und gerecht zu definieren.
Not-for-Proft Technologie als hörbare Stimme der Vielfalt gegen Monopolismus
Schon in den frühen 2000ern hatte Kelly mit einem Freund ein Start-up gegründet, um eine Sprachsteuerung zur Vereinfachung der Websuche zu entwickeln. Zuvor waren beide bei einem Start-Up, das Dialogsysteme entwickelte um mit Nutzern natürlich kommunizieren zu können. Beide Projekte sahen sich mit einer schwierigen finanziellen Dimension konfrontiert: Denn um neue Systeme der Spracherkennung zu entwickeln, braucht es eine Menge Daten. Daten, mit denen man die Technologie füttern muss, damit sie lernen kann, unsere Fragen zu verstehen und Antworten zu geben.
Kelly: „Das Problem ist, dass die großen Unternehmen, die unsere Daten über ihre Sprachassistenten sammeln, diese regelrecht einbunkern. Und für ihre Nutzung eine Gegenleistung verlangen. Das bedeutet, dass kleinere Start-ups mit ihren guten Ideen keine Chance haben, auf den Markt zu kommen. Das Projekt Common Voice will dafür sorgen, dass diese Vielfalt und die Chance für alle Menschen das Beste zu entwickeln, nicht verloren geht.”
Tausende Freiwillige unterstützen Kelly und sein Team bei Mozilla, um eine hörbare und vielfältige Stimme gegen diesen Monopolismus zu schaffen. Das Common Voice Project sorgt dafür, dass viel mehr Perspektiven für die Spracherkennung erforscht werden können. Das ist eine wichtige Voraussetzung dafür, Technologien zu entwickeln, die die wahren Bedürfnisse der Menschen wirklich respektieren und verstehen.
Nur, wenn es nicht um Profit, sondern um die beste Lösung für alle geht, kann die Spracherkennung ihr volles Zukunftspotential entfalten. Dafür steht das Common Voice Projekt, das auch deshalb einzigartig ist, weil die unterschiedlichsten Dialekte und Akzente aus der Mozilla Community einfließen. Verstehen und verstanden werden in einer Vielfalt, die aktuell den Markt beherrschende Spracherkennungstechnologien so niemals bieten könnten.
“Als ich vor 2,5 Jahren durch einen Freund zu Mozilla kam, habe ich gedacht: Wow, Mozilla ist wirklich einzigartig”, sagt Kelly. “Keine andere Community würde Sprachdaten in dieser gigantischen Größenordnung und kulturellen Diversität sammeln – für die ganze Welt tatsächlich – und diese dann der Öffentlichkeit zur Verfügung stellen.”
Technologien der Spracherkennung können viel Gutes tun
Eine der großen Stärken des Projektes Common Voice sei die Mozilla Community: “Man braucht Tausende über Tausende Stunden an Sprachdaten, um wirklich gute Sprachtechnologien entwickeln zu können. Man benötigt eine Community, die entsprechend groß ist und diese Daten spendet. Mozilla hat diese Community aus unterschiedlichen Nutzern, mit verschiedenen Akzenten und vielfältigen Sprachen.”
Was ist seine Vision, wenn er heute einen Blick weit in die Zukunft der Spracherkennungstechnologie wirft?
“Es gibt unendlich viele Möglichkeiten, in denen diese Technologie nützlich sein kann – von der Smart City bis zum Smart Home. Mir gefällt zum Beispiel der Gedanke, dass unsere Arbeit helfen kann, dass alte Menschen länger selbstständig zuhause leben können. Oder, dass wir der Medizin helfen können, wenn Menschen ihre Stimme verloren haben.”
Das Feedback, das das Common Voice Team jeden Tag von Freiwilligen erhält, ist für Kelly und sein Team die schönste Bestätigung, dass um Gestalten einer Zukunft, in der in der sich alle wohlfühlen können, nicht nur Vorausblick gehört, sondern auch eine große Verantwortung und Freude an Kollaboration und Austausch.
Das sind nur wenige der vielen großartigen Dinge, die das Common Voice Projekt ermöglicht. “Ich staune jeden Tag wieder, welches Interesse und welche Begeisterung das Common Voice Projekt auslöst”, sagt Kelly. “Immer mehr wollen mit ihrer Stimm-Spende dabei sein, Feedback geben, Ideen einbringen, wie man das Projekt auf andere Sprachen übertragen kann. Gemeinsam Großes in Bewegung setzen – das ist Mozilla. Deshalb bin ich so gerne dabei.”