L’IA explicable à l’épreuve des préférences humaines
Apprendre les préférences d’un décideur tout en expliquant les recommandations produites : c’est l’objectif de la thèse de Margot Herin, réalisée au laboratoire LIP6 (LIP6 - CNRS/Sorbonne Université). À l’interface de la théorie de la décision, de la recherche opérationnelle et de l’apprentissage automatique, elle développe des modèles d’intelligence artificielle explicable et a été récompensée pour ce travail par le prix de thèse Gilles Kahn 2025 et le prix de thèse 2025 du Groupement de recherche Recherche opérationnelle et décision (GDR ROD).
Train, voiture ou avion ? Pour choisir un trajet, nous faisons instinctivement des compromis. Le prix, la durée, le confort ou encore l’empreinte carbone entrent dans notre calcul mental. Et chacun de nous hiérarchise ces critères selon ses propres préférences. À petite échelle, la décision reste simple. Mais lorsque les options — projets publics, choix industriels — se multiplient et que les combinaisons de décisions possibles explosent, les arbitrages deviennent bien plus complexes.
Comment modéliser alors des préférences pour aider à la prise de décision ? Et surtout : comment produire des recommandations scientifiquement fondées et explicables ? C’est précisément l’enjeu de la thèse de Margot Herin, réalisée au LIP6 sous la direction de Patrice Perny, professeur à Sorbonne université et membre du LIP6 et Nataliya Sokolovska, professeure à Sorbonne université et membre du Laboratoire de Biologie Computationnelle, Quantitative et Synthétique (CQSB – CNRS/Sorbonne université) . Elle explique : « L’idée était de marier la théorie de la décision et l’apprentissage automatique, deux domaines aux outils complémentaires, pour concevoir des algorithmes capables d’apprendre des modèles de préférences tout en restant explicables ». Ces modèles sont dits expressifs, c'est-à-dire qu’ils permettent de représenter les interactions entre critères, ce qui les rend plus riches mais aussi potentiellement plus difficiles à interpréter.
D’un côté, les modèles issus de la théorie de la décision permettent de représenter les préférences de manière cohérente et interprétable. Ils garantissent aussi certaines propriétés de rationalité. Par exemple : une option meilleure sur tous les critères doit logiquement être préférée. Mais cette expressivité a un coût. « En autorisant les interactions entre critères, on se retrouve vite avec un nombre exponentiel de variables et de contraintes à gérer », souligne Margot Herin. Plus on ajoute de critères — prix, durée, impact environnemental, risque, etc. — plus le modèle devient difficile à ajuster à partir de données réelles. À l’inverse, les méthodes d’apprentissage automatique apprennent facilement à partir d’exemples de décisions, mais produisent souvent des modèles difficiles à interpréter.
Pour dépasser cette opposition, la chercheuse a développé des méthodes d’apprentissage parcimonieux pour des modèles décisionnels. Leur principe : séparer le signal du bruit. Concrètement, parmi tous les paramètres qui pourraient entrer en jeu, l’algorithme identifie ceux qui expliquent réellement les décisions observées et ignore le reste. L’algorithme développé par Margot Herin est ainsi capable de représenter des préférences complexes, mais avec beaucoup moins de paramètres à estimer. Il reste interprétable, tout en conservant les garanties de rationalité propres à la théorie de la décision.
Les algorithmes ont ensuite été validés sur plusieurs benchmarks de recherche. Mais ils ont aussi été testés dans un autre contexte, celui d’une collaboration interdisciplinaire : les décisions de justice concernant la prestation compensatoire lors d'un divorce. Une question rebelle à toute règle fixe. « Le Code civil donne des critères, mais aucune formule précise pour fixer le montant, explique Margot Herin. L’objectif n’est évidemment pas de remplacer le juge, mais de mieux comprendre ses logiques de décision afin d’éclairer la fixation de cette indemnité et d’aider les parties à mieux préparer un divorce ».
Ses travaux sont aujourd’hui récompensés par le prix de thèse Gilles Kahn 2025 de la Société informatique de France ainsi que le prix de thèse 2025 du GDR ROD « J’ai mis du temps à m’autoriser l’idée que j’étais capable de faire une thèse. Si la visibilité apportée par ce prix peut encourager d’autres étudiantes à dépasser cette autocensure, ce serait formidable », confie Margot Herin.
Désormais en postdoctorat à l'Instituto Superior Técnico de Lisbonne, elle poursuit ses travaux dans le domaine des agents conversationnels, ces systèmes d’IA fondés sur de grands modèles de langage. La même question de fond demeure, bien au-delà de ces travaux : peut-on faire confiance à une recommandation que l’on ne comprend pas ?