{"id":2492,"date":"2018-06-07T10:05:31","date_gmt":"2018-06-07T08:05:31","guid":{"rendered":"http:\/\/blog.mozilla.org\/press-de\/?p=2492"},"modified":"2018-06-07T11:34:12","modified_gmt":"2018-06-07T09:34:12","slug":"common-voice-wird-mehrsprachig","status":"publish","type":"post","link":"https:\/\/blog.mozilla.org\/press-de\/2018\/06\/07\/common-voice-wird-mehrsprachig\/","title":{"rendered":"Common Voice wird mehrsprachig"},"content":{"rendered":"<p><i>Heute ist es soweit: Wir ver\u00f6ffentlichen unsere mehrsprachige Version von <\/i><a href=\"http:\/\/voice.mozilla.org\/\" target=\"_blank\" rel=\"noopener\"><i>Common Voice<\/i><\/a><i>, Mozillas gro\u00dfer Crowdsourcing-Initiative f\u00fcr einen Stimmdatensatz zur Verwendung in der Spracherkennungstechnologie. Dank des unglaublichen Einsatzes von Mozillas Communities und unserer \u00e4u\u00dferst engagierten Sprachpartner k\u00f6nnen Sie Ihre Stimme jetzt auch auf Deutsch, Franz\u00f6sisch und Walisisch spenden. Dar\u00fcber hinaus arbeiten wir derzeit am <\/i><a href=\"https:\/\/voice.mozilla.org\/de\/languages\" target=\"_blank\" rel=\"noopener\"><i>Launch von mehr als 40 weiteren Sprachversionen<\/i><\/a><i>. Aber das ist erst der Anfang: F\u00fcr uns ist Common Voice ein Tool f\u00fcr jede Community, die Sprachtechnologie in ihrer eigenen Sprache verf\u00fcgbar machen m\u00f6chte.<br \/>\n<\/i><\/p>\n<p><a href=\"http:\/\/blog.mozilla.org\/press-de\/files\/2018\/06\/Common-Voice_Request-Language_German.png\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter size-full wp-image-2490\" src=\"http:\/\/blog.mozilla.org\/press-de\/files\/2018\/06\/Common-Voice_Request-Language_German.png\" alt=\"\" width=\"2442\" height=\"605\" srcset=\"https:\/\/blog.mozilla.org\/press-de\/files\/2018\/06\/Common-Voice_Request-Language_German.png 2442w, https:\/\/blog.mozilla.org\/press-de\/files\/2018\/06\/Common-Voice_Request-Language_German-300x74.png 300w, https:\/\/blog.mozilla.org\/press-de\/files\/2018\/06\/Common-Voice_Request-Language_German-768x190.png 768w, https:\/\/blog.mozilla.org\/press-de\/files\/2018\/06\/Common-Voice_Request-Language_German-600x149.png 600w, https:\/\/blog.mozilla.org\/press-de\/files\/2018\/06\/Common-Voice_Request-Language_German-1000x248.png 1000w\" sizes=\"(max-width: 2442px) 100vw, 2442px\" \/><\/a>Seit dem Start von Common Voice im Juli 2017 haben wir \u00fcber unsere <a href=\"http:\/\/voice.mozilla.org\/\" target=\"_blank\" rel=\"noopener\">Webseite<\/a> und die <a href=\"https:\/\/itunes.apple.com\/us\/app\/project-common-voice-by-mozilla\/id1240588326?mt=8\" target=\"_blank\" rel=\"noopener\">iOS-App<\/a> bereits hunderttausende englischsprachige Sprachsamples gesammelt. Im November konnten wir schlie\u00dflich <a href=\"https:\/\/blog.mozilla.org\/press-de\/2017\/11\/29\/common-voice-mozilla-veroffentlicht-den-zweitgrosten-offentlichen-sprachdatensatz\/\" target=\"_blank\" rel=\"noopener\">die erste Version des Common-Voice-Datensatzes bereitstellen<\/a>. Diese Daten wurden seither tausendfach heruntergeladen und sowohl in <a href=\"https:\/\/mycroft.ai\/blog\/mycroft-speech-to-text-and-balance\/\" target=\"_blank\" rel=\"noopener\">kommerziellen Spracherkennungsprodukten<\/a> als auch von Open-Source-Software wie <a href=\"https:\/\/github.com\/kaldi-asr\/kaldi\" target=\"_blank\" rel=\"noopener\">Kaldi<\/a> und unserer eigenen Sprache-zu-Text-Engine, dem Projekt <a href=\"https:\/\/github.com\/mozilla\/deepspeech\" target=\"_blank\" rel=\"noopener\">Deep Speech<\/a>, genutzt.<\/p>\n<p>Bis heute konnten lediglich englischsprachige Beitr\u00e4ge zu Common Voice hinzugef\u00fcgt werden. Ziel des Projekts war es jedoch seither, m\u00f6glichst viele Sprachen zu unterst\u00fctzen, um Spracherkennungstechnologie offener, leichter zug\u00e4nglich und insgesamt inklusiver zu gestalten. Deshalb haben wir in den letzten Monaten vor allem daran gearbeitet, individuelle Sprachgemeinschaften aufzubauen und ihnen die M\u00f6glichkeit zu geben, Common Voice in ihren jeweiligen Regionen, lokalen Sprachen und Dialekten einzuf\u00fchren.<\/p>\n<p>Zus\u00e4tzlich zur \u00dcbersetzung der Webseite pflegen diese Communities gemeinfreie (CC0-lizensierte) S\u00e4tze zum Vorlesen in Common Voice ein, die die notwendigen Voraussetzungen f\u00fcr einen qualitativ hochwertigen Datensatz erf\u00fcllen. Die Communities helfen auch dabei, die Webseite in ihren L\u00e4ndern bekannt zu machen, und weitere Mitwirkende f\u00fcr das Projekt zu begeistern, die die Gesamtstundenzahl der gesammelten Daten in der jeweiligen Sprache erh\u00f6hen.<\/p>\n<p><a href=\"http:\/\/blog.mozilla.org\/press-de\/files\/2018\/06\/multi-language-voice-dataset-de.jpg\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter size-full wp-image-2491\" src=\"http:\/\/blog.mozilla.org\/press-de\/files\/2018\/06\/multi-language-voice-dataset-de.jpg\" alt=\"\" width=\"1200\" height=\"800\" srcset=\"https:\/\/blog.mozilla.org\/press-de\/files\/2018\/06\/multi-language-voice-dataset-de.jpg 1200w, https:\/\/blog.mozilla.org\/press-de\/files\/2018\/06\/multi-language-voice-dataset-de-300x200.jpg 300w, https:\/\/blog.mozilla.org\/press-de\/files\/2018\/06\/multi-language-voice-dataset-de-768x512.jpg 768w, https:\/\/blog.mozilla.org\/press-de\/files\/2018\/06\/multi-language-voice-dataset-de-600x400.jpg 600w, https:\/\/blog.mozilla.org\/press-de\/files\/2018\/06\/multi-language-voice-dataset-de-1000x667.jpg 1000w\" sizes=\"(max-width: 1200px) 100vw, 1200px\" \/><\/a>Neben Englisch sammeln wir jetzt auch Proben in franz\u00f6sischer, deutscher und walisischer Sprache. Und es sind bereits mehr als 40 weitere Sprachen in Arbeit &#8211; nicht nur die gro\u00dfen, naheliegenden wie Spanisch, Chinesisch oder Russisch, sondern auch kleinere, wie etwa Friesisch, Norwegisch oder Tschuwaschisch. F\u00fcr uns sind diese Sprachen mit vergleichsweise kleinem Verbreitungsgebiet wichtig, weil sie von etablierten kommerziellen Digital- und Spracherkennungsdiensten h\u00e4ufig vernachl\u00e4ssigt werden. Stehen diese Daten jedoch erst einmal zur Verf\u00fcgung, k\u00f6nnen Unternehmer und Communities die bestehende L\u00fccke selbst schlie\u00dfen.<\/p>\n<p>Mehrere Sprachen anbieten zu k\u00f6nnen, ist ein gro\u00dfer Schritt f\u00fcr Common Voice und wir hoffen, dass das auch f\u00fcr die Sprachtechnologie im Allgemeinen gilt &#8211; denn ihre Demokratisierung kann nicht nur die H\u00fcrden f\u00fcr weltweite Innovation senken, sondern auch f\u00fcr den Zugang zu Informationen. Das gilt besonders f\u00fcr Menschen, deren Zugang bisher deutlich erschwert war &#8211; wie beispielsweise Sehbehinderte, Menschen, die nie zu lesen gelernt haben, Kinder, \u00e4ltere Menschen und viele andere.<\/p>\n<p>Wir sind begeistert \u00fcber die wachsende Unterst\u00fctzung, die wir beim Aufbau des weltweit gr\u00f6\u00dften \u00f6ffentlichen und mehrsprachigen Stimmdatensatzes erhalten. Jede*r kann uns <a href=\"https:\/\/voice.mozilla.org\/record\" target=\"_blank\" rel=\"noopener\">mit einer Sprachprobe<\/a> unterst\u00fctzen &#8211; auch \u00fcber die <a href=\"https:\/\/itunes.apple.com\/us\/app\/project-common-voice-by-mozilla\/id1240588326\" target=\"_blank\" rel=\"noopener\">iOS-App<\/a>. Wenn Sie uns dabei helfen m\u00f6chten, Common Voice und Spracherkennungstechnologie auch in ihrer Sprache verf\u00fcgbar zu machen, besuchen Sie unsere <a href=\"https:\/\/voice.mozilla.org\/languages\" target=\"_blank\" rel=\"noopener\">Sprachenseite<\/a>. Sie sind Mitglied einer Organisation und haben eine Idee, wie Sie sich in dieses Projekt einbringen k\u00f6nnen? Dann melden Sie sich gerne bei uns!<\/p>\n<p>Weitere Informationen dazu, wie Sie uns helfen k\u00f6nnen, finden Sie in unserem <a href=\"https:\/\/discourse.mozilla.org\/c\/voice\" target=\"_blank\" rel=\"noopener\">Forum<\/a> &#8211; das im \u00dcbrigen auch der ideale Ort ist, um Fragen zu stellen und die Communities kennenzulernen.<\/p>\n<h3><b>Besonderer Dank gilt&#8230;<\/b><\/h3>\n<p>Wir m\u00f6chten uns an dieser Stelle bei unserer Speech Advisory Group bedanken, also den Menschen, die als Experten und Ratgeber am Projekt Common Voice mitgewirkt haben:<\/p>\n<p>Francis Tyers &#8211; Assistenzprofessor f\u00fcr Computerlinguistik an der Higher School of Economics in Moskau.<\/p>\n<p>Gilles Adda &#8211; Sprachwissenschaftler<\/p>\n<p>Thomas Griffiths &#8211; Digital Services Officer, Office of the Legislative Assembly, Australien<\/p>\n<p>Joshua Meyer &#8211; Doktorand im Bereich Spracherkennung<\/p>\n<p>Delyth Prys &#8211; Sprachtechnologien im Forschungszentrum der Universit\u00e4t Bangor<\/p>\n<p>Dewi Bryn Jones &#8211; Sprachtechnologien im Forschungszentrum der Universit\u00e4t Bangor<\/p>\n<p>Wael Farhan &#8211; MS in Machine Learning von der UCSD, forscht derzeit an arabischem NLP bei Mawdoo3.com<\/p>\n<p>Eren G\u00f6lge &#8211; Wissenschaftler f\u00fcr Machine Learning, arbeitet derzeit an TTS f\u00fcr Mozilla<\/p>\n<p>Alaa Saade &#8211; Senior Scientist f\u00fcr Machine Learning @ Snips (Paris)<\/p>\n<p>Laurent Besacier &#8211; Professor an der Universit\u00e9 Grenoble Alpes, NLP, Sprachverarbeitung, Low-Resource-Sprachen<\/p>\n<p>David van Leeuwen &#8211; Sprachtechnologe<\/p>\n<p>Benjamin Milde &#8211; Doktorand im Bereich NLP\/Sprachverarbeitung<\/p>\n<p>Shay Palachy &#8211; M.Sc. in Informatik, Lead Data Scientist in einem Start-Up<\/p>\n<p>***<\/p>\n<p><i>Common Voice erg\u00e4nzt Mozillas Arbeit auf dem Gebiet der Spracherkennung, die unter dem Projektnamen &#8222;<\/i><a href=\"https:\/\/github.com\/mozilla\/DeepSpeech\" target=\"_blank\" rel=\"noopener\"><b><i>Deep Speech<\/i><\/b><\/a><i>&#8220; l\u00e4uft &#8211; einem Open-Source-Spracherkennungsmodell, das sich menschlicher Genauigkeit ann\u00e4hert und im November 2017 ver\u00f6ffentlicht wurde. Wir glauben, dass diese Technologie gemeinsam mit dem wachsenden Common-Voice-Datensatz eine Welle von innovativen Produkten und Dienstleistungen nicht nur ansto\u00dfen kann, sondern auch wird und dass sie f\u00fcr jeden zug\u00e4nglich sein sollte.<\/i><\/p>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Heute ist es soweit: Wir ver\u00f6ffentlichen unsere mehrsprachige Version von Common Voice, Mozillas gro\u00dfer Crowdsourcing-Initiative f\u00fcr einen Stimmdatensatz zur Verwendung in der Spracherkennungstechnologie. Dank des unglaublichen Einsatzes von Mozillas Communities &hellip; <a class=\"go\" href=\"https:\/\/blog.mozilla.org\/press-de\/2018\/06\/07\/common-voice-wird-mehrsprachig\/\">Mehr lesen<\/a><\/p>\n","protected":false},"author":495,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[19596],"tags":[],"_links":{"self":[{"href":"https:\/\/blog.mozilla.org\/press-de\/wp-json\/wp\/v2\/posts\/2492"}],"collection":[{"href":"https:\/\/blog.mozilla.org\/press-de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blog.mozilla.org\/press-de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blog.mozilla.org\/press-de\/wp-json\/wp\/v2\/users\/495"}],"replies":[{"embeddable":true,"href":"https:\/\/blog.mozilla.org\/press-de\/wp-json\/wp\/v2\/comments?post=2492"}],"version-history":[{"count":0,"href":"https:\/\/blog.mozilla.org\/press-de\/wp-json\/wp\/v2\/posts\/2492\/revisions"}],"wp:attachment":[{"href":"https:\/\/blog.mozilla.org\/press-de\/wp-json\/wp\/v2\/media?parent=2492"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blog.mozilla.org\/press-de\/wp-json\/wp\/v2\/categories?post=2492"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blog.mozilla.org\/press-de\/wp-json\/wp\/v2\/tags?post=2492"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}