Mozilla annonce aujourd’hui que Common Voice, son initiative pour collecter de manière participative une base de données de voix humaines exploitable par des technologies de reconnaissance vocale, devient multilingue ! Grâce aux efforts de la communauté Mozilla et à l’engagement de nos partenaires linguistiques, il est dorénavant possible de faire don de sa voix en allemand, en français et en gallois. Mozilla souhaite aller plus loin et travaille à l’ajout de 40 autres langues. Et ce n’est qu’un début. Mozilla veut mettre Common Voice à disposition de toutes les communautés qui souhaiteraient que les technologies vocales parlent leur langue.
Depuis le lancement de Common Voice en juillet dernier, Mozilla a collecté des centaines de milliers d’échantillons de voix en anglais via le site web et l’appli iOS. En novembre dernier avait été publiée la première version de la base de données Common Voice. Les données ont été téléchargées des milliers de fois et sont utilisées par des produits vocaux qui ont été commercialisés ainsi que par des logiciels Open Source comme Kaldi et le propre modèle de reconnaissance vocale de Mozilla, le projet Deep Speech.
Jusqu’à présent, il était uniquement possible de contribuer au projet Common Voice en anglais. L’objectif de Common Voice a toujours été de prendre en charge de nombreuses langues afin de rendre la technologie vocale plus ouverte, accessible et inclusive. Par conséquent, Mozilla a mis l’accent ces derniers mois sur le développement de communautés linguistiques capables de lancer Common Voice dans leur région, dans leur langue ou leur dialecte.
En plus de la traduction du site web, ces communautés contribuent à alimenter Common Voice avec des phrases libres de droit lues par différentes personnes pour constituer un ensemble de données de haute qualité. Elles assurent également la promotion du projet dans leur pays et créent une communauté de contributeurs avec l’objectif d’augmenter le nombre total d’heures de données collectées dans chaque langue.
En plus de l’anglais, Mozilla collecte à présent des échantillons vocaux en français, en allemand et en gallois. Une quarantaine d’autres langues devraient faire leur apparition, notamment des langues majeures comme l’espagnol, le chinois, le russe, mais aussi des langues moins répandues comme le norvégien et le tchouvache. Ces dernières sont tout aussi importantes car elles sont souvent mal prises en charge par les services de reconnaissance vocale et les technologies numériques existants. La mise à disposition de ces données va permettre aux entrepreneurs et aux populations de combler eux-mêmes ce manque.
Le passage au multilingue marque une étape importante pour Common Voice et c’est aussi un grand pas pour les technologies vocales en général. Leur démocratisation va non seulement favoriser l’innovation mais aussi faciliter l’accès à l’information, y compris pour des groupes de population parfois isolés comme les non et malvoyants, ceux qui n’ont pas pu apprendre à lire, les enfants, les personnes âgées et bien d’autres.
Mozilla se réjouit de l’engouement croissant suscité par la construction collaborative d’une base multilingue et publique de données vocales, la plus importante au monde. Nous rappelons que chacun peut y contribuer en faisant don de sa voix. Il est aussi possible d’utiliser l’appli iOS. Si vous souhaitez que votre langue vienne enrichir Common Voice et la technologie vocale, visitez la page dédiée. Si vous êtes une entreprise et souhaitez participer à ce projet, prenez contact.
Notre Forum explique en détail comment participer, vous pouvez y poser vos questions et rencontrer les communautés.
***
Common Voice complète les travaux de Mozilla dans le domaine de la reconnaissance vocale, nom de projet Deep Speech, un modèle de reconnaissance vocale open source proche de la précision humaine, distribué en novembre 2017. La base Common Voice ne cesse de s’enrichir et nous pensons que cette technologie, qui rendra possible la création de nouveaux produits et services innovants, devrait être accessible à tout le monde.