Claire Gardent : une médaille d’argent du CNRS pour le traitement automatique du langage

Distinctions Informatique

La discussion entre l’humain et la machine s’approfondit grâce au traitement automatique du langage. Cette discipline, unissant informatique et linguistique, connaît un important essor, porté en France notamment par Claire Gardent. Chercheuse au Laboratoire lorrain de recherche en informatique et ses applications (Loria - CNRS/Université de Lorraine/Inria), Claire Gardent a obtenu cette année la médaille d’argent du CNRS.

Entre les assistants vocaux et les traducteurs automatiques, la langue et l’informatique sont de plus en plus liées. Ces progrès sont dus à un domaine de recherche appelé le traitement automatique du langage (TAL), spécialité de Claire Gardent. Directrice de recherche CNRS au Loria, Claire Gardent a reçu la médaille d’argent du CNRS pour ses nombreuses contributions aux sciences du langage.

« Tout comme parler une langue et la comprendre sont deux choses différentes, le traitement automatique du langage s’effectue dans deux directions : du texte vers le sens, et inversement, précise Claire Gardent. Pendant longtemps, les travaux en TAL se sont concentrés sur l’analyse de textes, mais le développement de techniques comme les réseaux de neurones ont récemment facilité la génération de textes. »

Les textes se retrouvent ainsi aussi bien en entrée qu’en sortie du traitement, c’est-à-dire qu’ils peuvent être la source ou le produit. Claire Gardent a toujours concilié les deux approches, même si, depuis cinq ans, elle s’oriente vers les méthodes neuronales pour la génération de textes. Ce domaine a en effet trouvé de multiples applications, comme la simplification et/ou la synthèse de différents documents.

Les premiers travaux avec des textes en sortie visaient par exemple à transformer des données météo brutes en un bulletin complet. Avec Angela Fan (Meta AI Research Paris), Claire Gardent a récemment développé un système qui génère automatiquement, avec toute la structure attendue, une biographie Wikipédia à partir de données glanées en ligne. Claire Gardent anime actuellement l’une des quarante chaires de recherche et d’enseignement en intelligence artificielle financées par le gouvernement français, où elle travaille notamment la simplification de textes, pour passer d’un niveau expert à un document grand public ou à destination des enfants, le résumé multidocument, la génération multilingue et la conversion de bases de connaissances en textes.

Nous cherchons à généraliser les travaux sur la simplification de phrases afin de simplifier des documents entiers.

Soucieuse d’animer la communauté scientifique, Claire Gardent a lancé en 2017 un défi international autour de la tâche WebNLG1 , qui consiste à convertir le contenu de bases de données en textes. Si ces données sont couramment manipulées par les algorithmes, elles sont pour la plupart illisibles pour des humains. Reconduit en 2020, ce défi international a attiré quinze universités et centres de recherche industriels, permettant ainsi d’évaluer l’état de l’art dans ce domaine.

Depuis 2019, Claire Gardent dirige le groupement de recherche CNRS (GDR) Linguistique informatique, formelle et de terrain (LIFT), qui relie trois facettes de cette discipline. Les linguistes de terrain récupèrent des données peu ou pas étudiées, dans des langues qui ne sont pas forcément écrites et dont on comprend encore mal le fonctionnement. Les linguistes formels décrivent la structure de la langue dans des modèles formels. Enfin, les linguistes informaticiens développent et appliquent des méthodes informatiques pour une exploration automatique du langage. LIFT vise à rassembler ces trois communautés, notamment par la mise à disposition d’un large éventail de techniques et de ressources issues de la linguistique informatique.

  • 1Natural language generation for the semantic web
L’évolution des méthodes du TAL permet d’automatiser de nombreuses tâches souvent accomplies à la main

Toutes ces responsabilités et contributions scientifiques sont les fruits d’un parcours riche, qui a cependant failli garder la chercheuse à l’étranger. « Au départ je m’intéressais aux langues, puis j’ai suivi un cours donné sur la traduction automatique par Maghi King, directrice d’un institut de recherche à Genève, se souvient Claire Gardent. Comme le TAL n’était pas aussi développé en France qu’aujourd’hui, Maghi m’a conseillé de faire mon doctorat à Édimbourg. J’ai ensuite travaillé quelques années dans les universités d’Utrecht, d’Amsterdam et de la Sarre. Je ne pensais pas particulièrement rentrer en France, d’autant que mon mari était anglophone, mais j’ai été contactée par Jean-Marie Pierrel, qui a longtemps dirigé le laboratoire ATILF1 , pour me prévenir de l’ouverture d’un poste CNRS au LORIA. C’est comme ça que je suis revenue en France. » Un retour couronné par de nombreuses réussites scientifiques, et aujourd’hui par l’obtention de la médaille d’argent du CNRS.

  • 1Analyse et traitement informatique de la langue française (ATILF, CNRS/Université de Lorraine)

Contact

Claire Gardent
CNRS senior researcher, member of LORIA