À travers son programme No Language Left Behind, les contenus de Facebook, Instagram et Wikipédia seront traduites dans 200 langues dont 55 langues africaines grâce à l'intelligence artificielle "NLLB-200".
Si avant les langues utilisées sur les réseaux sociaux étaient les langues majoritaires parlées dans le monde comme le français, l'anglais, l'allemand…, très bientôt les applications de l'entreprise META de Mark Zuckerberg seront capables de traduire le contenu en plusieurs langues africaines.
Lire Aussi
Ce modèle d'IA a été conçu en priorité pour les langues africaines. En effet, il est difficile d'obtenir une traduction automatique de ces langues. Dans leurs conceptions, les modèles d'IA demandent de nombreuses données pour les aider à décoder, alors qu'il existe peu de données qui sont traduites par un humain pour ces langues. Prenons l'exemple du lingala qui est utilisé par des millions de personnes, mais les exemples d’écrits en cette langue sont extrêmement rares sur Internet.
Pour réussir ces exploits, l'entreprise a collaboré avec plusieurs traducteurs professionnels pour chacune de ces langues dans l'objectif d'évaluer la qualité de la traduction de celles-ci. Cela implique aussi de travailler avec des personnes natives de ces langues pour évaluer la traduction fournie par l’IA. Ces langues étant sectorielles, seule une partie du monde peut accéder au contenu du web et y participer dans sa propre langue. Mais, Meta souhaite créer des systèmes de traduction automatique plus inclusifs. Désormais les ivoiriens pourront comprendre les résumés en wolof des séries sénégalaises sur les réseaux sociaux.
Mark Zuckerberg, PDG de Meta, dans un message adressé sur son profil Facebook, donne ses impressions sur cette avancée.
"Nous l’avons formé à l’aide de notre nouveau Research SuperCluster, qui est l’une des super-machines de l’IA, les plus rapides au monde. Ces progrès permettront plus de 25 milliards de traductions chaque jour sur nos applications. La communication à travers les langues est une superpuissance fournie par l’IA, mais au fur et à mesure que nous évoluons dans nos projets d’IA, nous améliorons en même temps l’ensemble de nos travaux, de l’affichage des contenus les plus intéressants sur Facebook et Instagram, à la recommandation de publicités les plus pertinentes, en passant par la sécurité de nos services pour tous nos utilisateurs".
Pour assurer une meilleure garantie de cette IA, META a créé un nouvel ensemble de données d’évaluation, FLORES-200 et l'a comparé à NLLB-200 dans chaque langue. NLLB-200 dépasse la performance de la précédente technologie la plus pointue en matière de traduction de langue de 44 % en moyenne.
META va encore plus loin en nouant un partenariat avec Wikimédia Fondation, l’organisation à but non lucratif qui héberge Wikipédia ainsi que d’autres projets de contenus gratuits, afin de traduire le contenu dans 20 langues à faibles ressources, celles ne disposant pas d’assez de données pour former les systèmes d’IA, dont 10 qui n’étaient prises en compte auparavant par aucun outil de traduction automatique sur cette plateforme.
Les langues font partie intégrante des cultures africaines, ainsi avec ce nouveau projet, META donne la possibilité à un grand nombre de peuples d'avoir accès à l'information.