Banner-para-so-site-COMPLLEXUS

Google lança banco de dados de fala de código aberto para línguas africanas

Google lança banco de dados de fala de código aberto para línguas africanas
A Google anunciou o lançamento do WAXAL (falar, em tradução livre do wolof), um banco de dados de fala de código aberto desenvolvido em colaboração com universidades e instituições de investigação africanas, para apoiar o desenvolvimento de inteligência artificial (IA) baseada em voz para línguas do continente.
 
A plataforma, de acordo com a empresa, disponibiliza informação fundamental para 21 línguas da África Subsaariana, entre as quais hausa, luganda, iorubá, acholi, fulani, igbo, ikposo e suaíli. Ao todo, o WAXAL reúne mais de 11 mil horas de fala, extraídas de quase dois milhões de gravações individuais, recolhidas ao longo de três anos.
 
O projecto foi concebido para apoiar o desenvolvimento de sistemas de reconhecimento de fala, assistentes de voz, ferramentas de conversão de texto em fala e outras aplicações baseadas em voz, com potencial de utilização em sectores como a educação, a saúde, a agricultura e os serviços públicos.
 
Desenvolvido com financiamento e apoio técnico da Google, o WAXAL tem a missão de reduzir a escassez de dados linguísticos africanos de qualidade no ecossistema mundial de IA.
 
“Este conjunto de dados fornece a base essencial para que estudantes, investigadores e empreendedores desenvolvam tecnologia de acordo com as suas próprias condições e nos seus próprios idiomas”, afirmou Aisha Walcott-Bryantt, directora do Google Research Africa.
 
O lançamento do WAXAL ocorre num contexto de esforços crescentes em África para o desenvolvimento de tecnologias linguísticas que reflictam as culturas e realidades locais. Por exemplo, em Setembro de 2025, o governo da Nigéria apresentou o N-ATLAS, um modelo de linguagem de código aberto capaz de reconhecer e transcrever fala e gerar texto em iorubá, hausa, igbo e inglês com sotaque nigeriano.
 
Iniciativas semelhantes têm surgido também no sector privado. A startup sul-africana Lelapa AI, por exemplo, desenvolveu o Vulavula, uma ferramenta que integra reconhecimento de fala, tradução e análise de sentimentos.
 
Apesar da África Subsaariana albergar mais de 2.000 línguas, os dados da Google indicam que menos de 5% dispõem actualmente dos recursos necessários para o Processamento de Linguagem Natural, o que limita a eficácia dos sistemas de reconhecimento e síntese de voz para utilizadores africanos.
 
Ao disponibilizar dados de fala de forma aberta, o WAXAL pretende fornecer a base técnica para uma nova vaga de iniciativas locais focadas na inclusão das línguas africanas na era digital. A coleção completa do WAXAL foi lançada sob uma licença aberta e está disponível aqui.

Partilhar artigo:

Versao3 - Cópia

Somos um portal de notícias, voltado às tecnologias de informação e inovação tecnológica. Informamos com Rigor, Objectividade e Imparcialidade. Primamos pela qualidade, oferecendo aos nossos leitores, a inclusão tecnológica e a literacia digital

+(244) 930747817

info@pti.ao | redaccao@pti.ao

Mais Lidas

Últimos Artigos

Desenvolvido Por SP Media