L’Afrique vient de franchir un cap historique dans le monde de l’intelligence artificielle. Un consortium de chercheurs africains a dévoilé African Next Voices, le plus vaste corpus vocal jamais constitué pour les langues du continent.
Financée par la Fondation Bill & Melinda Gates, l’initiative a permis d’enregistrer plus de 9 000 heures de parole réelle en 18 langues africaines telles que le kikuyu, le hausa, le zoulou ou encore le yoruba. Une prouesse rendue possible grâce à la mobilisation d’équipes de linguistes et d’informaticiens basés au Kenya, au Nigeria et en Afrique du Sud.
Pourquoi est-ce une révolution ?
Aujourd’hui, la majorité des grands modèles de langage (ChatGPT, Claude, etc.) sont principalement entraînés sur des données en anglais ou en chinois. Résultat : des millions de locuteurs africains voient leurs langues locales invisibilisées dans l’univers numérique.
African Next Voices change la donne. Ce jeu de données ouvert devient une base précieuse pour :
Créer des outils de traduction adaptés aux réalités africaines,
Développer des systèmes de transcription automatique plus performants,
Concevoir des agents conversationnels capables de dialoguer en langues locales.
)
Une IA plus équitable et représentative
Derrière ce projet se cache un objectif clair : réduire le fossé linguistique et bâtir une intelligence artificielle véritablement inclusive, où les langues africaines ne sont plus des figurantes mais des actrices principales.
Et ce n’est qu’un début. Car au-delà des 18 langues déjà intégrées, l’Afrique francophone devrait également être pleinement représentée. La Côte d’Ivoire, par exemple, avec ses langues majeures comme le baoulé, le dioula ou le bété, possède un patrimoine linguistique riche qui mérite de résonner dans le numérique. Ces langues, tout comme le wolof au Sénégal ou l’éwé au Togo, sont essentielles pour que cette base de données reflète réellement la diversité africaine.
Et après ? Ce corpus n’est qu’une première étape. À terme, il pourrait inspirer la création d’applications éducatives, de solutions pour l’accessibilité, ou encore de plateformes de communication adaptées aux contextes africains.
African Next Voices, c’est la promesse d’une IA qui parle enfin avec nos voix, nos accents et nos histoires.
Aissatou Doumbia