Angela Bonifati et l’intégration de données graphes de propriétés

Distinctions Informatique

Angela Bonifati est nommée membre senior de l’Institut universitaire de France sur une chaire fondamentale. Cette professeure à l’Université Lyon 1 et responsable de l’équipe bases de données au Laboratoire d'informatique en image et systèmes d'information (LIRIS – CNRS/INSA de Lyon/Université Claude Bernard Lyon 1), va approfondir ses travaux sur les transformations de données graphes hétérogènes et contribuer à leur standardisation.

Lors d’une requête sur un moteur de recherche, des systèmes complexes relient la demande aux informations contenues dans les différentes sources de données. Ces connexions invisibles sont représentées à l’aide de graphes - des objets mathématiques dans lesquels des nœuds et des arêtes étiquetés peuvent matérialiser le sens de la relation qui les lie par des propriétés clé-valeur. Ils permettent ainsi de visualiser plus aisément les liens entre les données et de faciliter leur traitement. Bien que les graphes s’appliquent à des gigaoctets de données, leur exploitation n’est pas encore optimale. Un verrou majeur porte sur leur capacité d’intégration, c'est-à-dire leur aptitude à interroger des informations de natures diverses.

Cet enjeu est au cœur des travaux d’Angela Bonifati, professeure à l'Université Lyon 1, membre du LIRIS. « Les données graphes brutes peuvent contenir des incohérences et être incomplètes. Je développe des algorithmes qui aident à la compréhension de la qualité de ces données, qui détectent les erreurs et les intègrent dans le but de préparer les données pour l'intelligence artificielle », explique-t-elle.

Je me concentre sur des données de type graphe qui contiennent des liens sémantiques et des propriétés clé-valeur que l’on trouve dans un modèle très expressif de données appelé ''graphe de propriétés''.

Cet intérêt pour les données accompagne Angela Bonifati depuis son doctorat en informatique réalisé à l’École polytechnique de Milan (Italie). Au cours de post-doctorats en France et de séjours de professeure invitée au Canada et en Allemagne, elle s’est focalisée sur le requêtage de données, les modèles de données semi-structurés et l’intégration de données relationnelles. En 2015, elle intègre l’Université Claude Bernard Lyon 1 en tant que professeure en mutation de l’Université de Lille et mène des recherches sur les données hétérogènes. Ces travaux lui ont notamment valu le prix international de la société d’informatique IEEE TCDE Impact Award, faisant d’elle la plus jeune scientifique à recevoir cette distinction.

Quelques mois plus tard, la voici nommée membre senior de l’Institut universitaire de France (IUF) au titre d'une chaire fondamentale. Grâce à cette nomination, elle va approfondir ses recherches sur l’intégration des données graphes de différentes sources, jusqu’à présent peu regardée par les systèmes de gestion des bases de données. « Les systèmes actuels interrogent un seul graphe à la fois. Nous ne savons pas encore le généraliser et surtout l’automatiser à plusieurs sources. Ce sera un des objectifs de mon projet », décrit Angela Bonifati. Elle s’appuie pour cela sur des règles logiques appliquées à des données contraintes ou non par des schémas, des outils qui facilitent la manipulation des graphes.

Dans un cadre plus large, cette nomination tombe également à pic pour Angela Bonifati qui est aussi engagée dans plusieurs projets sur cette thématique. Elle coordonne notamment le projet HyGraph (requêtage et analytique pour les graphes hybrides – HyGraph), financé par l’Agence nationale de la recherche, qui est dédié à la gestion de graphes hybrides qui évoluent au cours du temps. Elle collabore également à l'international avec les entreprises Oracle et Neo4j - spécialisés dans la gestion de bases de données sur les graphes de propriétés.

Dans ce projet, je mets l’ensemble de mon expertise, notamment l’intégration de données sur laquelle je travaillais au préalable et les graphes de propriétés, ce qui est assez novateur et prometteur.

À terme, ces travaux profiteront aux nombreuses disciplines exploitant les données de type graphe comme les réseaux sociaux, la cybersécurité, la chimie, la finance, la logistique ou encore la génomique. Par ailleurs, Angela Bonifati est également impliquée auprès du Linked data benchmark council (LDBC), un groupe de travail international réunissant des chercheurs académiques et industriels visant à standardiser un langage dédié aux bases de données graphes. « Un de mes objectifs sera de traduire les règles logiques qui sont au cœur de mon projet IUF dans des langages de requêtes en cours de standardisation », ajoute Angela Bonifati.

Contact

Angela Bonifati
Professeure à l'Université Claude Bernard Lyon 1, membre du LIRIS