Flora Jay, entre génomes synthétiques et récits évolutifs

Distinctions Informatique

Flora Jay, chargée de recherche CNRS au Laboratoire interdisciplinaire des sciences du numérique (LISN - CNRS/Université Paris-Saclay), conçoit des outils d’analyse de données génétiques et de génération de génomes synthétiques pour explorer les grandes dynamiques évolutives des populations. Elle est récompensée par la médaille de bronze du CNRS.

L’ADN est un livre ouvert sur l’histoire des populations. Mais comment décoder cette encyclopédie ? Ces questions animent notamment la génétique des populations, discipline à l’interface entre biologie, mathématiques et sciences informatiques. Une spécialité que Flora Jay explore depuis sa thèse réalisée à Grenoble. Elle développe, dans un premier temps, des méthodes bayésiennes pour détecter la structure génétique de populations humaines et végétales en tenant compte de leur environnement. Elle bifurque ensuite vers la paléogénétique lors d’un post-doctorat à Berkeley (États-Unis) où elle rejoint un consortium dédié au séquençage des génomes anciens de Néandertal et Denisova. Elle affine alors des analyses bio-informatiques pour documenter le métissage entre ces espèces archaïques et caractériser la consanguinité chez certains individus néandertaliens. De retour en France, elle revient aux données modernes pour simuler et reconstruire l’histoire démographique humaine et animale. « La génétique des populations est un terrain fertile pour les dialogues interdisciplinaires. Les questions biologiques motivent beaucoup mes développements méthodologiques », confie-t-elle.

Ce qui m’anime, c’est de mélanger les idées, croiser les regards, et voir comment des outils développés ailleurs peuvent éclairer la génétique des populations.

Depuis son recrutement au CNRS en 2015, Flora Jay développe des méthodes d’apprentissage profond pour analyser les données génomiques brutes, sans passer par les statistiques expertes. L’objectif est de laisser les algorithmes extraire directement les signaux utiles à la génétique des populations. Avec Burak Yelmen, chercheur à l’Université de Tartu (Estonie), elle conçoit aussi des modèles génératifs capables de produire des génomes artificiels réalistes qui préservent ainsi la confidentialité des individus tout en conservant la richesse scientifique de données peu ou pas accessibles.

Générer des génomes artificiels et réalistes est une piste prometteuse pour faciliter le partage de données tout en respectant la confidentialité.

Elle collabore également avec des chercheuses au Mexique et aux États-Unis pour retracer les mélanges locaux de populations liés à la colonisation européenne et à la traite esclavagiste. Ces travaux explorent notamment comment ces événements ont influencé la circulation bactérienne. Ces recherches pourraient aider à identifier des agents pathogènes responsables d’épidémies passées encore non élucidées. Flora Jay s’investit enfin dans un projet visant à prédire la résistance bactérienne aux antibiotiques en combinant apprentissage statistique et analyse de données génomiques.

Contact

Flora Jay
Chargée de recherche CNRS au LISN