Como colaborar con Proxecto Trasno

Calquera, teña o perfil de habilidades que teña, pode achegar a súa area para mellorar a presenza da lingua na rede. Traballamos sempre sobre a base do que achegamos en calidade de voluntarios e voluntarias. Somos absolutamente independentes e autónomos. Algunhas posibilidades que serían colaboracións de interese en Proxecto Trasno:

Tradución e corrección

Desenvolvemento

Queres axudar a traducir ou corrixir software? Abonda con ter un bo galego e ganas de axudar a estandarizar un galego de calidade para as interfaces dos programas. Se queres programar, temos ferramentas útiles para o idioma que estamos desenvolvendo e sempre necesitamos automatizar tarefas na comunidade. Proxecto Trasno traballa en íntima relación cos principais proxectos internacionais de software libre e formamos un colectivo coñecido e de referencia internacional no noso idioma.

Coordinación de encontros e actividades

Deseño gráfico e márketing

Cando podemos, organizamos xornadas de tradución e formación en universidades e centros escolares, ou encontros para fixar acordos ás que chamamos Trasnadas ou de colaboración con outros grupos – e viríanos moi ben xente que poida axudar na súa organización. Deseñar campañas de promoción do software libre, difusión do galego nas redes e o noso propio sitio web necesita sempre ter unha comunicación verbal e gráfica adecuada aos nosos tempos e gústanos experimentar.
Ademais, traballamos sempre con software de deseño, edición e con formatos estándar abertos. Se podes achegar recursos gráficos, a que esperas?

Xestión de contidos

Creación de notas públicas no web e no foro, anuncios, responder á comunidade, crear páxinas de axuda. Ordenar os recursos. Sabemos aprecialo e non todo o mundo valemos para todo. Se ti sabes facelo, estamos esperándote.
Contacto:  proxecto@trasno.gal | @proxectotrasno | @proxectotrasno | Telegram

 

Proxecto Common Voice en galego

Doa a túa voz a Common Voice, o proxecto da Fundación Mozilla

Os voluntarios de Proxecto Trasno levamos moitos anos colaborando coa Fundación Mozilla, desde o nacemento no 2003,  e froito dese traballo todos os usuarios temos dispoñible o navegador de Internet Firefox en lingua galega,  sempre ao día coa última tecnoloxía da Web. E como esa moitas outras pezas necesarias para facer presente o noso idioma na rede.

Nos vindeiros anos, os servizos, produtos e estudos baseados na intelixencia artificial (IA) estarán por todas partes pero non poderemos interactuar en galego con eles non sendo que axudemos nisto.

Un asistente de voz, un lector de textos para persoas con necesidades especiais, asistente de condución en automóbil, un mordomo doméstico, un acompañante robótico para a vellez,… son algúns dos exemplos nos que o galego ten que estar presente, pero como podemos facer isto posible?

Para responder a esta pregunta a Fundación Mozilla creou o proxecto Common Voice. Un proxecto que quere crear unha tecnoloxía Open Source para que as máquinas que usaremos no futuro poidan entender e falar con calquera idioma do mundo. É importante que o Galego estea presente polo que desde o Proxecto Trasno estamos axudando aínda que precisamos da túa axuda!

Como podes axudarnos a que as máquinas falen e entendan galego?

O proxecto consiste en recadar un número importante de frases curtas de uso cotián para que, logo, falantes nativos galegos graven as súas voces interpretando esas frases recadadas. Todas as gravacións serán analizadas por este modelo e farán «maxicamente» que as máquinas entendan o noso prezado idioma.

Ao longo do proxecto podes axudarnos das seguintes formas:

  • Redactar frases orixinais e remitírnolas por correo a proxecto@trasno.gal. Crear 5 frases ou 50.
    No correo poñer
    Asunto: [CV] Frases para Common Voice
  • Colaborar na revisión das frases que deben estar correctamente escritas
  • Gravar as frases a viva voz, doando a túa voz co teu estilo, acento, modo e maneira de falar en galego. Ler 5 frases ou 50 ou máis, segundo poidas.

Porén hai outras tarefas nas que podes axudar:

  • Revisar as gravacións para comprobar que a gravación se entende ben e di exactamente o mesmo que o texto correspondente
  • Organizar unha quedada para recoller, revisar ou gravar pola túa conta e incorporarte ao proxecto de maneira directa
  • Difundir a iniciativa de Common Voice
  • Aproveitar a materia prima recollida para desenvolver o teu estudo, produto ou servizo (como a demo que amosamos ao fondo desta páxina).
  • Atopar fontes de textos libres en galego ou que poidan ser doados con licenza de dominio público CC0.

Que estamos facendo agora (Feb 2021)

Ola, son Martiño e busco colaboradores para o Common Voice en galego
Ola, son Martiño e busco colaboradores para o Common Voice en galego

Estamos na fase inicial do Common Voice en galego e, polo de agora o que necesitamos son máis de 5000 frases orixinais de vós, os e as falantes ou tomadas de fontes diversas.

É importante que se poidan doar con licenza de dominio público, a máis libre de todas as posibles. É dicir, non se poden extraer nin de libros nin de sitios web a non ser que teñamos permiso dos autores ou propietarios para doalas ao dominio público.

Neste momento temos recollidas 1717 (7/02/2021) porén precisamos moitas máis. Cada frase debe ser revisada por varias persoas, de modo que se garanta a súa corrección e pertinencia en galego. Contacta con nós en proxecto@trasno.gal ou date de alta directamente no sistema de recollida das frases.

En canto teñamos máis de 5000 frases validadas, abrirase a fase de gravación. Durante o proceso seguiremos recollendo máis frases pero ao mesmo tempo iremos cubrindo o obxectivo de 1000 horas de fragmentos de son necesarios para que a intelixencia artificial do DeepSpeech poida crear o modelo de lingua galega creado con intelixencia artificial.

Antes diso, dúas veces ao ano desde Common Voice irán creándose as coleccións de datos (datasets) que xuntarán os textos e as voces doadas, mantendo sempre o anonimato dos doadores e que permitirán crear xa aplicacións de menores requisitos: sistemas de navegación de automóbil, transcritores de voz a texto (STT) e mesmo os sintetizadores de voz (TTS), sistemas de ensino do idioma oral,  dos que tedes exemplos máis abaixo.

Os datasets estarán sempre abertos, libres e en crecemento porque son un ben común de dominio público, de todas e todos os que colaboramos.

Queres poñerte en contacto con nós?

Máis info: https://commonvoice.mozilla.org/gl/faq

Notas:
Un exemplo de frases (máximo 14 palabras por frase con sentido)

Cal é o contrasinal?
Fago de menos as discotecas
As filloas sábencheme ben desta vez!
Normalmente comemos cocido os domingos
O luns toca caldo
Vaime mal o wifi
Sabes se hoxe vai frío na Lanzada?
Ei, como andas?
Estou da máscara ata o carallo!
A miña irmá estuda o Grao en Enxeñaría da Enerxía en Vigo
Non o sei, a verdade.
Está sempre chorando polos cartos
Non teño nin idea
Que series ves en Netflix?
Non teño aínda moi claro o que facer
Xogámoslle unha partida ás cartas?
Cantoulle as corenta
Tes que ir máis amodo
Non corras tanto!
A que hora é a cea?

Minidemo (unha pequena aplicación que pasa voz a texto en calquera sistema)

Como funciona un sistema TTS (de texto a galego sintetizado) como sistema de accesibilidade: Cotovía sobre Ubuntu

Día da lingua materna 2021

Claro que non é só o TikTok! Iso é o que levamos décadas dicindo, e eses problemas, que non son técnicos, son solucionados moi facilmente utilizando software libre.

Estas empresas, fundadas para o lucro, que se permiten o luxo de determinar cando podemos utilizar o noso idioma e con quen, en que condicións, que se aproveitan dos usuarios que enchen con contidos de interese e de balde a súa rede, que confían na protección dos seu datos persoais, mil veces vulnerada pero logo recortan os seus dereitos políticos… por que son legais?

Unha empresa pode establecer a política cultural que se lle antolle, claro que si; pero se vulnera os dereitos dos consumidores-usuarios-cidadáns dunha sociedade, como é o caso aquí, temos o dereito e o deber de defendernos, a recibir o apoio das autoridades que teñen o poder lexítimo para evitar que estas empresas poidan operar no noso espacio e mercado democrático.

As empresas cometen erros, é normal, pero teñen que admitir que as reconduzan, teñen que someterse á lei e senón terán que se expulsadas. En que sociedade moderna se defende ou se xustifica hoxe o monolingüismo? Non é normal, non é a realidade, é política.

#Díadalinguamaterna

https://autonomico.elconfidencialdigital.com/asset/zoomcrop,1366,800,center,center/media/elconfidencialautonomico/images/2017/02/04/ECDIMA20170204_0003_1.jpgO 24 deste mes é Día de Rosalía de Castro, o espirito nacional contemporáneo do noso país, mañá é o Día da Lingua Materna, da lingua nativa e propia de Galicia é o luns é o Día dos Datos abertos.

#CoaForzadeRosalía, #DíadeRosalía

#aculturasegue

É un pracer celebrar o noso idioma sen límites nin falsos teitos de cristal.

 

Día dos datos abertos 2021

https://odd2021acoruna.gitlab.io/#inscricion

Como novidade haberá redifusión en liña (Streaming)

Organiza:  Asociación de usuarios de software libre da Terra de Melide  |  melisa.gal

 

Duración de cada charla: entre 20 y 40 minutos aproximadamente

Presentadores de las charlas matutinas:

Santi Rey y Marelisa Blanco

Presentadores de las charlas vespertinas:

Sofía Prósper y Paco Estrada

HORA CHARLA PONENTE
10:00 1 – Datos abiertos, SL y medio ambiente David Marzal y Voro MV
2 – Datos abiertos y otros dramas legislativos Bárbara Román
3 – GeoAprendizaje Libre Baltasar Ortega
4 – Archive.org: Tu repositorio multimedia Creative Commons Juan Febles
5 – Tráfico y calidad de aire en Santiago de Compostela Rafael R. Gaioso
14:30 PAUSA PARA COMER
16:00 6 – Análisis de datos abiertos con radiant Miguel Muíños
7 – Exportando datos de OSM con overpass-turbo para la creación de un mapa en umap Jorge Lama
8 – Tus libros ya no son tuyos Javier Teruelo
9 – Los datos abiertos en la lucha contra incendios Marta Rodríguez Barreiro (ITMATI) y Mª José Ginzo Villamayor (USC)

Discourse en galego

Descrición da foto non dispoñibleAcabamos de rematar a primeira tradución completa de Discourse na súa actual versión de desenvolvemento 2.7.0-beta3
A memoria de tradución, en formato estándar XLIFF está á vosa disposición no noso repositorio de Trasno.gal (licenza libre GNU v2)
54 284 palabras de orixe
7107 cadeas ou unidades de tradución
1 2 3 39