Kann die Welt mit einer Stimme sprechen?

Kann die Welt mit einer Stimme sprechen?

Warum nicht, wenn alle mitreden dürfen! Für das Common Voice Projekt von Mozilla sammelt Kelly Davis die größtmögliche Vielfalt an Stimmen, damit in Zukunft jeder mit Computern sprechen kann und auch verstanden wird, unabhängig von seiner Herkunft. Doch was braucht die Zukunft der Spracherkennung, um eine gute zu werden? Muss Innovation bedeuten, dass wir auf Dinge verzichten, die wir früher geschätzt haben?

Es gibt nicht viele Menschen, die die Gabe haben, Jahrzehnte weit vorausschauen zu können. Lange bevor sich Siri unaufgefordert aus dem Handy in Gespräche einmischte oder sich Amazons Alexa über den Echo-Lautsprecher in unsere Wohnzimmer lauschte, hatte Kelly Davis, Manager der Machine Learning Group von Mozilla, eine klare Vision davon, wie wir mit Computern mithilfe von Spracherkennungssoftware so sprechen könnten, dass es für alle Menschen eine wirkliche Bereicherung wäre.

 

Wir treffen Kelly am Teehaus im Englischen Garten, einem seiner Lieblingsorte in Berlin. Und ein Ort großer Geschichte. Das Teehaus steht auf dem Fundament des ehemaligen Wohnhauses der deutschen Theaterlegende Gustav Gründgens. 1952 gebaut, zur Einweihung des Englischen Gartens, der eine Hommage an die britisch-deutsche Zusammenarbeit während der Berlin Blockade war. Es ist noch früh am Morgen, das Teehaus noch geschlossen, ein weicher Dunst liegt über der Blumenpracht, die sich in üppig-präziser Eleganz in abgezirkelte Beete ordnet, wie es sich für einen Englischen Garten gehört.

Die Freiheit zu sein, wer man ist

Es gibt noch ein paar schöne Beständigkeiten, die Kelly schätzt. Und die ihn in seinem Leben begleiten, indem er oft mehr Zeit damit verbringt an einer Zukunft  zu arbeiten, die allen Menschen gerecht wird, als in seinem eigenen Jetzt.

 

Sein Zwanziger-Jahre-Outfit  –  Schiebermütze, Hosenträger, polierte Spectator Schuhe – Kellys Markenzeichen, gehört auch dazu. Kelly sagt:  “Das ist ein Stil, der zu mir passt. Er gefällt mir einfach!” Die Freiheit zu sein, wer man ist. Dass jeder Mensch dieses Recht auf Teilhabe, Vielfalt und Chancen hat, das steht für Kelly im Zentrum seiner Arbeit.

 

Das Projekt Common Voice, an dem Kelly mit seinem Team bei Mozilla und vielen Freiwilligen arbeitet, tritt an, die Spielregeln für die Zukunft der Spracherkennung neu und gerecht zu definieren.

Not-for-Proft Technologie als hörbare Stimme der Vielfalt gegen Monopolismus

Schon in den frühen 2000ern hatte Kelly mit einem Freund ein Start-up gegründet, um eine Sprachsteuerung zur Vereinfachung der Websuche zu entwickeln. Zuvor waren beide bei einem Start-Up, das Dialogsysteme entwickelte um mit Nutzern natürlich kommunizieren zu können. Beide Projekte sahen sich mit einer schwierigen finanziellen Dimension konfrontiert: Denn um neue Systeme der Spracherkennung zu entwickeln, braucht es eine Menge Daten. Daten, mit denen man die Technologie füttern muss, damit sie lernen kann, unsere Fragen zu verstehen und Antworten zu geben.

 

Kelly: „Das Problem ist, dass die großen Unternehmen, die unsere Daten über ihre Sprachassistenten sammeln, diese regelrecht einbunkern. Und für ihre Nutzung eine Gegenleistung verlangen. Das bedeutet, dass kleinere Start-ups mit ihren guten Ideen keine Chance haben, auf den Markt zu kommen. Das Projekt Common Voice will dafür sorgen, dass diese Vielfalt und die Chance für alle Menschen das Beste zu entwickeln, nicht verloren geht.”

 

Tausende Freiwillige unterstützen Kelly und sein Team bei Mozilla, um eine hörbare und vielfältige Stimme gegen diesen Monopolismus  zu schaffen. Das Common Voice Project sorgt dafür, dass viel mehr Perspektiven für die Spracherkennung erforscht werden können. Das ist eine wichtige Voraussetzung dafür, Technologien zu entwickeln, die die wahren Bedürfnisse der Menschen wirklich respektieren und verstehen.

 

Nur, wenn es nicht um Profit, sondern um die beste Lösung für alle geht, kann die Spracherkennung ihr volles Zukunftspotential entfalten. Dafür steht das Common Voice Projekt, das auch deshalb einzigartig ist, weil die unterschiedlichsten Dialekte und Akzente aus der Mozilla Community einfließen. Verstehen und verstanden werden in einer Vielfalt, die aktuell den Markt beherrschende Spracherkennungstechnologien so niemals bieten könnten.

 

“Als ich vor 2,5 Jahren durch einen Freund zu Mozilla kam, habe ich gedacht: Wow, Mozilla ist wirklich einzigartig”, sagt Kelly. “Keine andere Community würde Sprachdaten in dieser gigantischen Größenordnung und kulturellen Diversität sammeln – für die ganze Welt tatsächlich – und diese dann der Öffentlichkeit zur Verfügung stellen.”

Nur, wenn es nicht um Profit, sondern um die beste Lösung für alle geht, kann die Spracherkennung ihr volles Zukunftspotential entfalten.

Technologien  der Spracherkennung können viel Gutes tun

Eine der großen Stärken des Projektes Common Voice sei die Mozilla Community: “Man braucht Tausende über Tausende Stunden an Sprachdaten, um wirklich gute Sprachtechnologien entwickeln zu können. Man benötigt eine Community, die entsprechend groß ist und diese Daten spendet. Mozilla hat diese Community aus unterschiedlichen Nutzern, mit verschiedenen Akzenten und vielfältigen Sprachen.”

 

Was ist seine Vision, wenn er heute einen Blick weit in die Zukunft der Spracherkennungstechnologie wirft?

 

“Es gibt unendlich viele Möglichkeiten, in denen diese Technologie nützlich sein kann – von der Smart City bis zum Smart Home. Mir gefällt zum Beispiel der Gedanke, dass unsere Arbeit helfen kann, dass alte Menschen länger selbstständig zuhause leben können. Oder, dass wir der Medizin helfen können, wenn Menschen ihre Stimme verloren haben.”

 

Das Feedback, das das Common Voice Team jeden Tag von Freiwilligen erhält, ist für Kelly und sein Team die schönste Bestätigung, dass um Gestalten einer Zukunft, in der in der sich alle wohlfühlen können, nicht nur Vorausblick gehört, sondern auch eine große Verantwortung und Freude an Kollaboration und Austausch.

"Unsere Arbeit kann dabei helfen, dass alte Menschen länger selbstständig zuhause leben können. Oder das Menschen, die ihre Stimme verloren haben, wieder verstanden werden."

Das sind nur wenige der vielen großartigen Dinge, die das Common Voice Projekt ermöglicht. “Ich staune jeden Tag wieder, welches Interesse und welche Begeisterung das Common Voice Projekt auslöst”, sagt Kelly. “Immer mehr wollen mit ihrer Stimm-Spende dabei sein, Feedback geben, Ideen einbringen, wie man das Projekt auf andere Sprachen übertragen kann. Gemeinsam Großes in Bewegung setzen – das ist Mozilla. Deshalb bin ich so gerne dabei.”

“Ich staune jeden Tag wieder, welches Interesse und welche Begeisterung das Common Voice Projekt auslöst”

Das Common Voice Projekt ist auch deshalb so attraktiv, weil das Mitmachen so viel Spaß macht und das Stimme-Spenden so einfach ist: Auf voice.mozilla.org bekommt man Sätze anboten, die man laut vorliest. Sie stammen aus den verschiedensten Büchern, Texten, Artikeln. “Aktuell sind diese Sätze alle auf Englisch, aber bald werden wir natürlich auch anderssprachige Sätze sammeln”, sagt Kelly.

 

Wer nicht sprechen möchte, kann sich auch anders beteiligen: sich bereits eingesprochene Sätze anhören und in ihrer Verständlichkeit bewerten. Achtung: Suchtgefahr! Denn man fängt auf einmal an, die verschiedensten Akzente, die unterschiedlichsten Persönlichkeiten und überraschende Textzeilen zu entdecken. Und das ist wirklich äußerst vergnüglich. Und wichtig: Je mehr Menschen bewerten, desto besser kann die Common Voice Technologie lernen.

Wirklich jeder ist eingeladen mitzumachen. Beinahe jedenfalls. Mo (der langhaarige Charmer) und Elli (die Überlebenskünstlerin), Kellys Mischlingshunde, die er aus einem spanischen Tierheim geholt hat, haben noch nicht ins Mikrofon gebellt: „Sie heben sich für Common Bark auf!“ sagt Kelly und lacht.

 

Unsere Schritte haben Spuren hinterlassen auf dem taufeuchten feinen Kies vor dem Teehaus an dem wir nun wieder ankommen. Kelly zieht sich die Weste im Zwanziger-Jahre-Stil wieder an, die er während des Spaziergangs über der Schulter getragen hat.  Senkt den Kopf in der ihm eigenen bescheidenen Art, lächelt, und sagt: „Ich wollte die ganze Zeit schon etwas machen, kann ich jetzt? Sind wir fertig?“ Als ich neugierig bejahe, zückt er sein Telefon und fotografiert ein Blatt an einem Baum. „Ginko!“ sagt er dann. Aber das wusste er schon, die App hat es nur validiert.

Text: Anja Fordon
Fotos: Falko Siewert
Mehr Info: https://voice.mozilla.org/

Spende jetzt Deine Stimme für das Project Common Voice

Lese einen Satz, und helfe Maschinen zu lernen, wie Menschen sprechen oder höre Dir die Beiträge von anderen an, um die Qualität zu verbessern. Es ist so einfach!

Jetzt probieren!

Mehr People of Mozilla