{"id":1573,"date":"2017-11-29T17:00:44","date_gmt":"2017-11-29T16:00:44","guid":{"rendered":"http:\/\/blog.mozilla.org\/press-es\/?p=1573"},"modified":"2017-11-29T17:00:44","modified_gmt":"2017-11-29T16:00:44","slug":"commonvoicemozilladatosvoz","status":"publish","type":"post","link":"https:\/\/blog.mozilla.org\/press-es\/2017\/11\/29\/commonvoicemozilladatosvoz\/","title":{"rendered":"Compartimos nuestro Common Voice: Mozilla lanza el segundo mayor conjunto de datos de voz p\u00fablico"},"content":{"rendered":"<p>Desde el lanzamiento de Common Voice, hemos recopilado cientos de miles de muestras de voz a trav\u00e9s de nuestra p\u00e1gina<a href=\"http:\/\/voice.mozilla.org\/\" target=\"_blank\" rel=\"noopener\"> <u>web<\/u> <\/a>y la <a href=\"https:\/\/itunes.apple.com\/us\/app\/project-common-voice-by-mozilla\/id1240588326?mt=8\" target=\"_blank\" rel=\"noopener\"><u>aplicaci\u00f3n de iOS<\/u><\/a>. Hoy lanzamos una primera versi\u00f3n de esa colecci\u00f3n de voces de <a href=\"https:\/\/creativecommons.org\/choose\/zero\/\" target=\"_blank\" rel=\"noopener\"><u>dominio p\u00fablico.<\/u><\/a><\/p>\n<p>Desde el principio, Mozilla ha confiado en la creatividad, la compasi\u00f3n y el ingenio de personas de todo el mundo para ayudarnos a construir y promover la web como un recurso p\u00fablico global, accesible para todos. Esta ha sido la base de nuestro trabajo experimental en el campo del <a href=\"https:\/\/research.mozilla.org\/machine-learning\/\" target=\"_blank\" rel=\"noopener\"><em><u>machine learning<\/u><\/em><u> y el reconocimiento de voz<\/u><\/a>, y de la construcci\u00f3n de un gran repositiorio de datos de voz de alta calidad con Common Voice.<\/p>\n<p>Esta colecci\u00f3n contiene aproximadamente 400.000 grabaciones de 20.000 personas diferentes, dando lugar a unas 500 horas de discurso. Hasta la fecha, ya es el segundo mayor conjunto de datos de voz disponible para el p\u00fablico que conocemos, \u00a1y gente de todo el mundo est\u00e1 agregando y validando muestras nuevas todo el tiempo!<\/p>\n<p>De hecho, puedes <a href=\"https:\/\/voice.mozilla.org\/data\" target=\"_blank\" rel=\"noopener\"><u>descargar los datos<\/u><\/a> ahora mismo.<\/p>\n<p><a href=\"https:\/\/blog.mozilla.org\/press-es\/files\/2017\/11\/CommonVoice.jpg\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter size-large wp-image-1576\" src=\"https:\/\/blog.mozilla.org\/press-es\/files\/2017\/11\/CommonVoice-600x278.jpg\" alt=\"\" width=\"600\" height=\"278\" srcset=\"https:\/\/blog.mozilla.org\/press-es\/files\/2017\/11\/CommonVoice-600x278.jpg 600w, https:\/\/blog.mozilla.org\/press-es\/files\/2017\/11\/CommonVoice-252x117.jpg 252w, https:\/\/blog.mozilla.org\/press-es\/files\/2017\/11\/CommonVoice-768x356.jpg 768w, https:\/\/blog.mozilla.org\/press-es\/files\/2017\/11\/CommonVoice.jpg 1255w\" sizes=\"(max-width: 600px) 100vw, 600px\" \/><\/a><\/p>\n<p>Habiendo experimentado nosotros mismos lo dif\u00edcil que puede ser encontrar datos p\u00fablicamente disponibles para nuestro trabajo de tecnolog\u00eda de voz, tambi\u00e9n proporcionamos enlaces a todas las otras grandes colecciones de voz que conocemos en la web. Y estamos ansiosos por continuar haciendo crecer la p\u00e1gina web como un centro de datos de voz.<\/p>\n<p>Cuando miramos el ecosistema de voz actual, vemos muchos desarrolladores, fabricantes, nuevas empresas e investigadores que quieren experimentar y construir tecnolog\u00edas habilitadas para voz. Pero la mayor\u00eda de nosotros solo tenemos acceso a una recopilaci\u00f3n bastante limitada de datos de voz, un componente esencial para crear motores de reconocimiento de voz de alta calidad. Estos datos de voz pueden costar m\u00e1s de decenas de miles de euros y su escala es insuficiente para crear un reconocimiento de voz al nivel que la gente espera. Al proporcionar este nuevo conjunto de datos p\u00fablicos, queremos ayudar a superar estas barreras y facilitar la creaci\u00f3n de nuevos y mejores sistemas de reconocimiento de voz (como nuestro propio <a href=\"https:\/\/github.com\/mozilla\/DeepSpeech\" target=\"_blank\" rel=\"noopener\"><u>Deep Speech<\/u><\/a>). Hemos empezado con el ingl\u00e9s, pero pronto admitiremos todos los idiomas. Con nuestro trabajo paralelo en un motor de conversi\u00f3n de voz a texto de c\u00f3digo abierto, esperamos abrir la tecnolog\u00eda de voz para que pueda participar m\u00e1s gente, innovar y competir con los grandes.<\/p>\n<p>\u00bfEst\u00e1s interesado en conocer nuestro proyecto de reconocimiento de voz de fuente abierta Deep Speech y c\u00f3mo los datos de Common Voice se pueden utilizar para crear mejores productos de reconocimiento de voz? Reuben Morais, del equipo de Machine Learning de Mozilla, acaba de publicar un art\u00edculo sobre su &#8220;Viaje a una tasa de error de palabra de menos del 10%&#8221; [enlace al art\u00edculo de Hacks]. Este art\u00edculo es un resumen de los desaf\u00edos y aprendizajes a los que se enfrentaron mientras trabajaban en el primer modelo de motor de reconocimiento de voz de c\u00f3digo abierto del equipo, \u00a1que se ha lanzado hoy en el <a href=\"http:\/\/github.com\/mozilla\/DeepSpeech\" target=\"_blank\" rel=\"noopener\"><u>repositorio de Github<\/u>!<\/a><\/p>\n<p>Continuamos recibiendo colaboradores en Common Voice. Por favor, ponte en contacto cualquier idea que tengas sobre c\u00f3mo podemos trabajar juntos, contarnos c\u00f3mo utilizas los datos, o para darnos tu opini\u00f3n sobre c\u00f3mo este proyecto podr\u00eda ser m\u00e1s \u00fatil.<\/p>\n<p><a href=\"https:\/\/blog.mozilla.org\/press-es\/files\/2017\/11\/ThankYou.jpg\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter size-large wp-image-1577\" src=\"https:\/\/blog.mozilla.org\/press-es\/files\/2017\/11\/ThankYou-600x408.jpg\" alt=\"\" width=\"600\" height=\"408\" srcset=\"https:\/\/blog.mozilla.org\/press-es\/files\/2017\/11\/ThankYou-600x408.jpg 600w, https:\/\/blog.mozilla.org\/press-es\/files\/2017\/11\/ThankYou-252x171.jpg 252w, https:\/\/blog.mozilla.org\/press-es\/files\/2017\/11\/ThankYou-768x522.jpg 768w, https:\/\/blog.mozilla.org\/press-es\/files\/2017\/11\/ThankYou.jpg 783w\" sizes=\"(max-width: 600px) 100vw, 600px\" \/><\/a><\/p>\n<p>Nos gustar\u00eda dar las gracias a Mycroft, SNIPS, Universidad de Bangor, LibriSpeech, VoxForge, TED-LIUM, Tatoeba.org, Mythic, SAP y, por supuesto, a todos nuestros <a href=\"https:\/\/github.com\/mozilla\/voice-web\/graphs\/contributors\" target=\"_blank\" rel=\"noopener\"><u>colaboradores en Github<\/u><\/a>. \u00a1No podr\u00edamos haber progresado as\u00ed sin vosotros!<\/p>\n<p><em>Tambi\u00e9n estamos constantemente buscando mejorar la calidad de nuestro conjunto de datos. \u00a1Dir\u00edgete a la <a href=\"http:\/\/voice.mozilla.org\/\" target=\"_blank\" rel=\"noopener\"><u>p\u00e1gina web de Common Voice<\/u><\/a> ahora y ay\u00fadanos a verificar las grabaciones, que es igual de importante que donar tu voz!<\/em><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Desde el lanzamiento de Common Voice, hemos recopilado cientos de miles de muestras de voz a trav\u00e9s de nuestra p\u00e1gina web y la aplicaci\u00f3n de iOS. Hoy lanzamos una primera &hellip; <a class=\"go\" href=\"https:\/\/blog.mozilla.org\/press-es\/2017\/11\/29\/commonvoicemozilladatosvoz\/\">Read more<\/a><\/p>\n","protected":false},"author":593,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":true,"template":"","format":"standard","meta":{"footnotes":""},"categories":[5],"tags":[290452,31466,289112],"_links":{"self":[{"href":"https:\/\/blog.mozilla.org\/press-es\/wp-json\/wp\/v2\/posts\/1573"}],"collection":[{"href":"https:\/\/blog.mozilla.org\/press-es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blog.mozilla.org\/press-es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blog.mozilla.org\/press-es\/wp-json\/wp\/v2\/users\/593"}],"replies":[{"embeddable":true,"href":"https:\/\/blog.mozilla.org\/press-es\/wp-json\/wp\/v2\/comments?post=1573"}],"version-history":[{"count":0,"href":"https:\/\/blog.mozilla.org\/press-es\/wp-json\/wp\/v2\/posts\/1573\/revisions"}],"wp:attachment":[{"href":"https:\/\/blog.mozilla.org\/press-es\/wp-json\/wp\/v2\/media?parent=1573"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blog.mozilla.org\/press-es\/wp-json\/wp\/v2\/categories?post=1573"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blog.mozilla.org\/press-es\/wp-json\/wp\/v2\/tags?post=1573"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}