Proxecto Common Voice en galego

Doa a túa voz a Common Voice, o proxecto da Fundación Mozilla

https://trasno.gal/download/Trasno_CV-Colector.mkv

Os voluntarios de Proxecto Trasno levamos moitos anos colaborando coa Fundación Mozilla, desde o nacemento no 2003,  e froito dese traballo todos os usuarios temos dispoñible o navegador de Internet Firefox en lingua galega,  sempre ao día coa última tecnoloxía da Web. E como esa moitas outras pezas necesarias para facer presente o noso idioma na rede.

Nos vindeiros anos, os servizos, produtos e estudos baseados na intelixencia artificial (IA) estarán por todas partes pero non poderemos interactuar en galego con eles non sendo que axudemos nisto.

Un asistente de voz, un lector de textos para persoas con necesidades especiais, asistente de condución en automóbil, un mordomo doméstico, un acompañante robótico para a vellez,… son algúns dos exemplos nos que o galego ten que estar presente, pero como podemos facer isto posible?

Para responder a esta pregunta a Fundación Mozilla creou o proxecto Common Voice. Un proxecto que quere crear unha tecnoloxía Open Source para que as máquinas que usaremos no futuro poidan entender e falar con calquera idioma do mundo. É importante que o Galego estea presente polo que desde o Proxecto Trasno estamos axudando aínda que precisamos da túa axuda!

Como podes axudarnos a que as máquinas falen e entendan galego?

O proxecto consiste en recadar un número importante de frases curtas de uso cotián para que, logo, falantes nativos galegos graven as súas voces interpretando esas frases recadadas. Todas as gravacións serán analizadas por este modelo e farán «maxicamente» que as máquinas entendan o noso prezado idioma.

Ao longo do proxecto podes axudarnos das seguintes formas:

  • Redactar frases orixinais e remitírnolas por correo a proxecto@trasno.gal. Crear 5 frases ou 50.
    No correo poñer
    Asunto: [CV] Frases para Common Voice
  • Colaborar na revisión das frases que deben estar correctamente escritas
  • Gravar as frases a viva voz, doando a túa voz co teu estilo, acento, modo e maneira de falar en galego. Ler 5 frases ou 50 ou máis, segundo poidas.

Porén hai outras tarefas nas que podes axudar:

  • Revisar as gravacións para comprobar que a gravación se entende ben e di exactamente o mesmo que o texto correspondente
  • Organizar unha quedada para recoller, revisar ou gravar pola túa conta e incorporarte ao proxecto de maneira directa
  • Difundir a iniciativa de Common Voice
  • Aproveitar a materia prima recollida para desenvolver o teu estudo, produto ou servizo (como a demo que amosamos ao fondo desta páxina).
  • Atopar fontes de textos libres en galego ou que poidan ser doados con licenza de dominio público CC0.

Que estamos facendo agora (Feb 2021)

Ola, son Martiño e busco colaboradores para o Common Voice en galego
Ola, son Martiño e busco colaboradores para o Common Voice en galego

Estamos na fase inicial do Common Voice en galego e, polo de agora o que necesitamos son máis de 5000 frases orixinais de vós, os e as falantes ou tomadas de fontes diversas.

É importante que se poidan doar con licenza de dominio público, a máis libre de todas as posibles. É dicir, non se poden extraer nin de libros nin de sitios web a non ser que teñamos permiso dos autores ou propietarios para doalas ao dominio público.

Neste momento temos recollidas 1717 (7/02/2021) porén precisamos moitas máis. Cada frase debe ser revisada por varias persoas, de modo que se garanta a súa corrección e pertinencia en galego. Contacta con nós en proxecto@trasno.gal ou date de alta directamente no sistema de recollida das frases.

En canto teñamos máis de 5000 frases validadas, abrirase a fase de gravación. Durante o proceso seguiremos recollendo máis frases pero ao mesmo tempo iremos cubrindo o obxectivo de 1000 horas de fragmentos de son necesarios para que a intelixencia artificial do DeepSpeech poida crear o modelo de lingua galega creado con intelixencia artificial.

Antes diso, dúas veces ao ano desde Common Voice irán creándose as coleccións de datos (datasets) que xuntarán os textos e as voces doadas, mantendo sempre o anonimato dos doadores e que permitirán crear xa aplicacións de menores requisitos: sistemas de navegación de automóbil, transcritores de voz a texto (STT) e mesmo os sintetizadores de voz (TTS), sistemas de ensino do idioma oral,  dos que tedes exemplos máis abaixo.

Os datasets estarán sempre abertos, libres e en crecemento porque son un ben común de dominio público, de todas e todos os que colaboramos.

Queres poñerte en contacto con nós?

Máis info: https://commonvoice.mozilla.org/gl/faq

Notas:
Un exemplo de frases (máximo 14 palabras por frase con sentido)

Cal é o contrasinal?
Fago de menos as discotecas
As filloas sábencheme ben desta vez!
Normalmente comemos cocido os domingos
O luns toca caldo
Vaime mal o wifi
Sabes se hoxe vai frío na Lanzada?
Ei, como andas?
Estou da máscara ata o carallo!
A miña irmá estuda o Grao en Enxeñaría da Enerxía en Vigo
Non o sei, a verdade.
Está sempre chorando polos cartos
Non teño nin idea
Que series ves en Netflix?
Non teño aínda moi claro o que facer
Xogámoslle unha partida ás cartas?
Cantoulle as corenta
Tes que ir máis amodo
Non corras tanto!
A que hora é a cea?

Minidemo (unha pequena aplicación que pasa voz a texto en calquera sistema)

Como funciona un sistema TTS (de texto a galego sintetizado) como sistema de accesibilidade: Cotovía sobre Ubuntu