Kategorien: Open Innovation

Common Voice wird mehrsprachig

Heute ist es soweit: Wir veröffentlichen unsere mehrsprachige Version von Common Voice, Mozillas großer Crowdsourcing-Initiative für einen Stimmdatensatz zur Verwendung in der Spracherkennungstechnologie. Dank des unglaublichen Einsatzes von Mozillas Communities und unserer äußerst engagierten Sprachpartner können Sie Ihre Stimme jetzt auch auf Deutsch, Französisch und Walisisch spenden. Darüber hinaus arbeiten wir derzeit am Launch von mehr als 40 weiteren Sprachversionen. Aber das ist erst der Anfang: Für uns ist Common Voice ein Tool für jede Community, die Sprachtechnologie in ihrer eigenen Sprache verfügbar machen möchte.

Seit dem Start von Common Voice im Juli 2017 haben wir über unsere Webseite und die iOS-App bereits hunderttausende englischsprachige Sprachsamples gesammelt. Im November konnten wir schließlich die erste Version des Common-Voice-Datensatzes bereitstellen. Diese Daten wurden seither tausendfach heruntergeladen und sowohl in kommerziellen Spracherkennungsprodukten als auch von Open-Source-Software wie Kaldi und unserer eigenen Sprache-zu-Text-Engine, dem Projekt Deep Speech, genutzt.

Bis heute konnten lediglich englischsprachige Beiträge zu Common Voice hinzugefügt werden. Ziel des Projekts war es jedoch seither, möglichst viele Sprachen zu unterstützen, um Spracherkennungstechnologie offener, leichter zugänglich und insgesamt inklusiver zu gestalten. Deshalb haben wir in den letzten Monaten vor allem daran gearbeitet, individuelle Sprachgemeinschaften aufzubauen und ihnen die Möglichkeit zu geben, Common Voice in ihren jeweiligen Regionen, lokalen Sprachen und Dialekten einzuführen.

Zusätzlich zur Übersetzung der Webseite pflegen diese Communities gemeinfreie (CC0-lizensierte) Sätze zum Vorlesen in Common Voice ein, die die notwendigen Voraussetzungen für einen qualitativ hochwertigen Datensatz erfüllen. Die Communities helfen auch dabei, die Webseite in ihren Ländern bekannt zu machen, und weitere Mitwirkende für das Projekt zu begeistern, die die Gesamtstundenzahl der gesammelten Daten in der jeweiligen Sprache erhöhen.

Neben Englisch sammeln wir jetzt auch Proben in französischer, deutscher und walisischer Sprache. Und es sind bereits mehr als 40 weitere Sprachen in Arbeit – nicht nur die großen, naheliegenden wie Spanisch, Chinesisch oder Russisch, sondern auch kleinere, wie etwa Friesisch, Norwegisch oder Tschuwaschisch. Für uns sind diese Sprachen mit vergleichsweise kleinem Verbreitungsgebiet wichtig, weil sie von etablierten kommerziellen Digital- und Spracherkennungsdiensten häufig vernachlässigt werden. Stehen diese Daten jedoch erst einmal zur Verfügung, können Unternehmer und Communities die bestehende Lücke selbst schließen.

Mehrere Sprachen anbieten zu können, ist ein großer Schritt für Common Voice und wir hoffen, dass das auch für die Sprachtechnologie im Allgemeinen gilt – denn ihre Demokratisierung kann nicht nur die Hürden für weltweite Innovation senken, sondern auch für den Zugang zu Informationen. Das gilt besonders für Menschen, deren Zugang bisher deutlich erschwert war – wie beispielsweise Sehbehinderte, Menschen, die nie zu lesen gelernt haben, Kinder, ältere Menschen und viele andere.

Wir sind begeistert über die wachsende Unterstützung, die wir beim Aufbau des weltweit größten öffentlichen und mehrsprachigen Stimmdatensatzes erhalten. Jede*r kann uns mit einer Sprachprobe unterstützen – auch über die iOS-App. Wenn Sie uns dabei helfen möchten, Common Voice und Spracherkennungstechnologie auch in ihrer Sprache verfügbar zu machen, besuchen Sie unsere Sprachenseite. Sie sind Mitglied einer Organisation und haben eine Idee, wie Sie sich in dieses Projekt einbringen können? Dann melden Sie sich gerne bei uns!

Weitere Informationen dazu, wie Sie uns helfen können, finden Sie in unserem Forum – das im Übrigen auch der ideale Ort ist, um Fragen zu stellen und die Communities kennenzulernen.

Besonderer Dank gilt…

Wir möchten uns an dieser Stelle bei unserer Speech Advisory Group bedanken, also den Menschen, die als Experten und Ratgeber am Projekt Common Voice mitgewirkt haben:

Francis Tyers – Assistenzprofessor für Computerlinguistik an der Higher School of Economics in Moskau.

Gilles Adda – Sprachwissenschaftler

Thomas Griffiths – Digital Services Officer, Office of the Legislative Assembly, Australien

Joshua Meyer – Doktorand im Bereich Spracherkennung

Delyth Prys – Sprachtechnologien im Forschungszentrum der Universität Bangor

Dewi Bryn Jones – Sprachtechnologien im Forschungszentrum der Universität Bangor

Wael Farhan – MS in Machine Learning von der UCSD, forscht derzeit an arabischem NLP bei Mawdoo3.com

Eren Gölge – Wissenschaftler für Machine Learning, arbeitet derzeit an TTS für Mozilla

Alaa Saade – Senior Scientist für Machine Learning @ Snips (Paris)

Laurent Besacier – Professor an der Université Grenoble Alpes, NLP, Sprachverarbeitung, Low-Resource-Sprachen

David van Leeuwen – Sprachtechnologe

Benjamin Milde – Doktorand im Bereich NLP/Sprachverarbeitung

Shay Palachy – M.Sc. in Informatik, Lead Data Scientist in einem Start-Up

***

Common Voice ergänzt Mozillas Arbeit auf dem Gebiet der Spracherkennung, die unter dem Projektnamen „Deep Speech“ läuft – einem Open-Source-Spracherkennungsmodell, das sich menschlicher Genauigkeit annähert und im November 2017 veröffentlicht wurde. Wir glauben, dass diese Technologie gemeinsam mit dem wachsenden Common-Voice-Datensatz eine Welle von innovativen Produkten und Dienstleistungen nicht nur anstoßen kann, sondern auch wird und dass sie für jeden zugänglich sein sollte.