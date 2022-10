Laurence Meurant, professeure en linguistique et directrice du LSFB-Lab, s’est alors mise à rêver avec son équipe de linguistes et d’informaticiens d’un outil plus performant, inspiré du dictionnaire bilingue en ligne Linguee et destiné à un vaste public.

Dès 2018, ils ont donc planché sur un outil permettant de comprendre et d’utiliser adéquatement les mots, les expressions ou les signes dans des contextes variés. Quatre ans plus tard, ils sont fiers de présenter leur dictionnaire contextuel bilingue français-LSFB utilisant la reconnaissance faciale, qui a été mis au point avec le soutien financier du fonds Baillet Latour.

"Chaque langue des signes est différente d’un pays à l’autre. Elle n’est pas uniforme comme on pourrait le croire, révèle Benoît Frénay, professeur en informatique et expert en intelligence artificielle. Cet outil est une première mondiale. Il n’existe dans aucun autre pays, même pas pour la langue des signes américaine ou anglaise."

Faciliter l’inclusion

Concrètement, l’utilisateur peut signer en se positionnant devant la caméra de son ordinateur (où la tête est entourée d’un cercle comme dans un photomaton) et il obtiendra non seulement la signification du mot recherché mais aussi les contextes dans lesquels il peut être utilisé. "Passer du français à la langue des signes est déjà un fameux défi. Mais le contraire est encore plus complexe, relève Benoît Frénay. Chaque signeur est différent ; certains vont plus vite ou sont plus aguerris que d’autres, ils ont une morphologie différente et renvoient une luminosité différente, ce qui complexifie la tâche de l’intelligence artificielle. Chaque signeur engendre un squelette constitué de points, qui est comparé à d’autres.C’est ainsi que l’on peut voir si l’enchaînement de mouvements ressemble à un autre déjà enregistré dans d’autres vidéos. On peut ainsi identifier le signe et faire une série de propositions."

Chaque signeur engendre un squelette constitué de points, qui est comparé à d’autres. ©ÉdA-Vincent Lorent

Inversement, l’utilisateur peut encoder un mot dans le moteur de recherche et il obtiendra sa traduction en langue des signes ainsi qu’une liste de suggestions d’usage de ce signe, sous forme de vidéos.

Nul besoin d’un studio d’enregistrement. Grâce à un système de reconnaissance de pointe, le dictionnaire est capable en un laps de temps limité de détecter, reconnaître et traduire précisément le signe soumis par l’utilisateur, quel que soit l’environnement dans lequel il se trouve.

"Il peut donc être utilisé directement par les élèves, les enseignants, les traducteurs et les familles dans leur classe ou à la maison, indique Laurence Meurant. Il suffit d’avoir une caméra et une connexion Internet et c’est accessible via ordinateur, smartphone ou tablette. C’est destiné à n’importe quelle personne qui a besoin de faire le pont entre la langue des signes et le français. Ça facilite l’inclusion des sourd·e·s dans la société."

Amélioration constante

Ce dictionnaire repose sur une base de données en langue des signes très riche utilisant les productions de cent signeurs, totalisant 88 h 15 de conversations filmées dont 36 heures annotées et traduites en français pour en faire un répertoire de textes bilingues.

Ce corpus est le fruit d’un travail de fourmis de plusieurs années. Un monitoring des erreurs sera mis en place pour que le système de reconnaissance faciale permettant de détecter le signe de l’utilisateur soit sans cesse amélioré et affiné. "Actuellement, on couvre environ 750 signes, les plus fréquents et utiles. Mais cela permettra d’enrichir le corpus et de fournir des traductions encore plus précises", estime Anthony Cleve, professeur en informatique et expert en modélisation de bases de données. L’UNamur vise même une portée mondiale puisque la technologie peut être appliquée à d’autres couples langue vocale-langue signée.

Le dictionnaire est accessible gratuitement sur le site https://dico.corpus-lsfb.be.