Banque & Finance
KYC vocal, interfaces mobile money et chatbots dans les langues que les clients parlent vraiment.
Datasets ouverts, modèles NLP/ASR/TTS et outils linguistiques pour les 500+ langues bantoues parlées en Afrique centrale, orientale et australe — en commençant par le lingala.
Des centaines de millions de locuteurs. Quasi-aucune représentation dans les grands systèmes d'IA. Les deux chiffres sont réels.
Les plus grands modèles de langage au monde sont entraînés sur des données massivement anglaises, mandarines, et issues d'une poignée de langues européennes. Quand 350 millions de personnes qui parlent une langue bantoue tentent d'utiliser un assistant vocal, un chatbot, un moteur de recherche — les systèmes ne font même pas semblant d'écouter.
Ce n'est pas un caprice de la technologie. C'est une question de quelles voix ont été jugées dignes d'être enregistrées. Nous existons pour changer cette réponse — pas en agitant des slogans sur l'« IA pour l'Afrique », mais en livrant le travail patient et précis qui fait vraiment l'infrastructure : datasets propres, pipelines reproductibles, benchmarks publics.
Si on ne peut pas l'entraîner dessus, l'évaluer, et l'améliorer en open source — ça n'existe pas pour l'IA. C'est ce qu'on change.
Textes, audios, transcriptions. Sourcés auprès des communautés, archives, médias et partenaires académiques.
Nettoyage, normalisation, annotation, alignement. Pipelines reproductibles, scripts publics, versionnés.
Release ouverte sur Hugging Face, avec model cards, licence, data sheets et guide de contribution.
Modèles NLP, ASR, TTS de référence. APIs, SDKs et partenariats avec les builders du continent.
L'infrastructure est fondamentale. Les applications qu'elle rend possibles touchent toutes les sphères de la vie publique et économique.
KYC vocal, interfaces mobile money et chatbots dans les langues que les clients parlent vraiment.
Assistants médicaux vocaux, traduction de diagnostics, interfaces patient accessibles dans les zones reculées.
Outils d'apprentissage en langue maternelle, applis d'alphabétisation, ressources augmentées pour les enseignants du primaire.
Services publics accessibles dans les langues locales : traduction officielle, agents IA citoyens.
APIs et SDKs prêts à l'emploi pour les builders africains qui livrent des applis localisées.
Sous-titrage, archivage, préservation linguistique. Outils pour journalistes, diffuseurs et conteurs.
Le lingala est la lingua franca de Kinshasa — ville de quinze millions d'habitants et l'une des plus dynamiques au monde — et de la majeure partie du bassin du Congo. Il est chanté à travers l'Afrique, diffusé sur des dizaines de radios, et utilisé chaque jour dans les marchés, les bureaux, les écoles et les ministères.
Il est aussi fonctionnellement invisible pour les systèmes d'IA qui médient de plus en plus la banque, l'éducation et la santé. Commencer ici est un choix de poids : une grande langue africaine, une riche tradition orale et écrite, et un écart mesurable que nous pouvons combler.
« Mbote na yo, ndenge nini ozali ? »
Bonjour, comment vas-tu ? · [mbote na jo, ndenge nini oˈzali]
Premier corpus textuel ouvert du lingala en preview. Scripts de nettoyage et de tokenisation publiés en parallèle.
Pipelines de traitement reproductibles + CI sur l'organisation GitHub publique. Guide contributeur rédigé.
BantuLanguages Initiative officiellement créée. Hubs fondateurs à Brazzaville et Kinshasa.
Rapport public de référence cartographiant l'écart entre la couverture LLM actuelle et la famille des langues bantoues.
Chercheurs, développeurs, linguistes, fondations, ministères — nous construisons une communauté aussi multilingue que les langues qu'elle sert. Recevez les prochaines releases, les appels à contribution et les notes de recherche par email.