Le projet Cap'Falc, soutenu notamment par l'Unapei, vise à mettre au service de la transcription en facile à lire et à comprendre (Falc) des algorithmes d'intelligence artificielle et de "machine learning". Il devrait être opérationnel en 2021.
Un laboratoire de recherche de l'Institut national de recherche en informatique et en automatique (Inria) et Facebook AI Research, en partenariat avec l'Unapei, est en train de concevoir un outil d'aide à la transcription en facile à lire et à comprendre (Falc). Nommé Cap'Falc, il devrait voir le jour en 2021, selon un communiqué de l'Unapei. "À l'heure où la demande de transcription augmente, Cap'Falc permettra de répondre à la demande tout en capitalisant sur l'expertise d'usage si incontournable des personnes handicapées dans la production des textes en Falc pour in fine une société plus accessible et plus inclusive", explique Luc Gateau, président de l'Unapei. En effet, de plus en plus de documents sont produits en Falc. Très récemment, peuvent être citées à titre d'exemple les très nombreuses fiches d'explications des gestes barrières durant la pandémie de Covid-19. Ainsi, "l'objectif de notre projet de recherche était de voir si nous ne pouvions pas utiliser des outils d'intelligence artificielle qui peuvent aider les ateliers à traiter plus de demandes", raconte Louis Martin, doctorant au sein de l'équipe Almanach d'Inria et de Facebook AI Research à Paris, interrogé par Hospimedia.
Un outil couteau-suisse
Concrètement, "il y a plusieurs étapes qui peuvent être automatisées. Par exemple, celle qui consiste pour les transcripteurs à surligner des passages selon un code couleur qui leur indique quelles phrases simplifier ou supprimer, peut être automatisable", expose-t-il. "Je sais également qu'ils passent du temps à chercher des synonymes sur Internet et vérifier qu'ils collent bien au contexte. Nous pouvons les aider à faire cela en proposant d'emblée une liste de synonymes ou de bouts de phrase pour un mot compliqué." Si le projet de recherche fondamentale est donc déjà bien enclenché, il reste encore à concevoir l'interface de l'outil qui puisse être utilisé par tous. "Nous voulons vraiment que l'outil soit utilisable par tous et qu'il soit disponible en open source mais le public cible reste les personnes en situation de handicap." Il ne s'agit toutefois pas de dévoyer la démarche Falc : "si l'outil est disponible sur Internet, je pense qu'il y aura de grosses mentions pour rappeler que les personnes en situation de handicap mental doivent être incluses dans le processus. Cap'Falc n'est pas suffisant, il aide mais ne change en rien la nécessité qu'un usager relise et valide la transcription." Autre écueil, à l'heure actuelle, l'outil ne prend pas encore en compte les pictogrammes, assez centraux pour la compréhension de certains. "Ceci étant, nous avons déjà commencé à réfléchir à ce que nous pourrions faire pour proposer une sous-sélection de pictogrammes en fonction du texte", souligne le thésard. Reste donc à voir de quelles fonctionnalités disposera l'outil d'ici à 2021.
Comment nourrir l'algorithme ?
Généralement, les algorithmes d'intelligence artificielle requièrent des masses de données faramineuses pour "apprendre" la tâche qui leur est donnée. Le problème est qu'il n'existe pas actuellement de "données parallèles" suffisantes en facile à lire et à comprendre, à savoir des phrases en Falc et leur pendant d'origine. Par conséquent, les chercheurs ont dû contourner le problème : "dans les grandes lignes, notre approche a été de récupérer énormément de texte provenant d'Internet en espérant avoir des exemples de phrases simples", décrit Louis Martin. "Ensuite, nous repérons les phrases qui veulent dire à peu près la même chose. Ce que nous donnons à manger à l'algorithme, c'est la phrase qui a l'air la plus compliquée et nous lui demandons de la réécrire avec un degré de complexité plus faible." La suite logique sera donc d'adapter ce niveau de complexité aux critères de compréhension du Falc.
Edoxie Allier
Aucun commentaire:
Enregistrer un commentaire