Recherche

Champ scientifique aux méthodes expérimentales et aux fondements théoriques en constante évolution, les sciences de l’information irriguent toute la recherche. Grâce notamment au calcul intensif, l’INS2I occupe une place centrale dans l’émergence de nouveaux domaines d’études souvent situés à la croisée de plusieurs disciplines.

Thématiques

La recherche en sciences de l’information couvre un vaste champ thématique qui ne cesse de s’étendre au contact des autres disciplines et du monde socio-économique.

Qu’ils soient au cœur de la discipline ou aux interfaces, les axes de recherche évoluent et se diversifient.

Des axes de recherches au cœur des sciences de l'information...

  •  Informatique fondamentale et algorithmique ;
  •  Sciences des données et des connaissances ;
  •  Sécurité et protection des informations ;
  •  Réseaux et systèmes (objets communicants, calcul distribué) ;
  •  Traitement du signal, des images, du langage ;
  •  Systèmes autonomes et interactifs (robotique, interaction humain-machine, modélisation, commande et observation des systèmes) ;
  •  Systèmes sur puce et systèmes embarqués.

... et aux interfaces avec les autres disciplines

L’interdisciplinarité est au cœur des activités de l’INS2I. De nouveaux axes de recherche émergent à l’interface des autres disciplines et peuvent, à l’image de la bio-informatique, constituer des thématiques à part entière, avec leurs propres objets de recherche. Les axes suivants sont d’ores et déjà investis avec une approche multidisciplinaire :

  • Bio-informatique ;
  • Astro-informatique ;
  • Modèles de calcul quantique ;
  • Modélisation du cerveau ;
  • Cognition et interaction ;
  • Usine du futur et modélisation de processus industriels ;
  • Ville du futur et aide et systèmes d’aides aux décisions complexes.

 

Livrets thématiques de l'INS2I

          Cybersécurité                robotique      

          IA                Quantique

Actions transverses

L’institut mobilise les forces de ses laboratoires autours d’enjeux transversaux correspondant à des priorités nationales de recherche, en autres la cybersécurité, l'IA, l'informatique quantique et le traitement automatique des langues.

 

Le calcul intensif : un pari sur la performance

Le calcul haute performance pour la simulation numérique et le traitement de grandes masses de données, aussi appelé calcul intensif ou analyse de données haute performance, constitue un enjeu stratégique pour la production de nouvelles connaissances scientifiques. De la structuration de ce domaine dépendent la compétitivité et l’attractivité scientifiques du CNRS, et plus généralement de la communauté académique française.

Dans toutes les disciplines, le calcul intensif est devenu indispensable pour produire de nouvelles connaissances. Les moyens considérables qu’il requiert implique la collaboration de nombreux acteurs de la recherche.

L'Institut du développement et des ressources en informatique scientifique (Idris)

Situé sur le campus de l'Université Paris-Sud à Orsay, l’Idris est le principal centre de calcul numérique intensif de très haute performance du CNRS. Grâce aux investissments réalisés par le Genci, cette unité propre de service sous tutelle de l’INS2I met ses ressources informatiques exceptionnelles à la disposition de la communauté scientifique publique. Depuis 2013, l’Idris bénéficie notamment de la puissance de calcul des superordinateurs Ada et Turing qui vont être renouvelés en 2018.

Voir le site de l'Idris

La Mission calcul–données (MiCaDo)

L’INS2I joue un rôle de premier plan dans la Mission calcul–données (MiCaDo) qui met en œuvre la politique du CNRS en matière de calcul haute performance, de grilles, de cloud et d’infrastructures de données massives. MiCaDo veille en particulier à construire une stratégie conjointe avec les partenaires du CNRS et assurer sa cohérence avec les actions nationales et internationales.

Voir le site de la MiCaDo

Télécharger le livre Blanc sur les données

Le Grand équipement national de calcul intensif (Genci)

L’INS2I élabore sa stratégie en matière de calcul intensif en concertation avec le CEA, Inria et les pôles universitaires, au sein du Grand équipement national de calcul intensif (Genci). Cette très grande infrastructure de recherche (TGIR) assure la maîtrise d'ouvrage des moyens de calcul nationaux répartis dans trois centres de calcul à Bruyères-le-Châtel, Montpellier et Orsay.

Voir le site du Genci

L’intelligence artificielle : la connaissance est dans les données, l’intelligence dans les algorithmes

Thème moteur ayant accompagné le développement de l’informatique, l’intelligence artificielle (IA) a connu récemment un essor spectaculaire grâce au développement de nouveaux algorithmes d’apprentissage exploitant les très grandes masses de données et les architectures de calcul intensif. Au-delà de l’apprentissage qui cristallise les espoirs et les interrogations, la recherche en IA couvre une large palette de thématiques nourries par de nouveaux domaines d’application comme la robotique et l’interaction humain-machine, la voiture autonome, les jeux sérieux et l’aide à la décision, le contrôle et la commande de systèmes industriels complexes, la santé personnalisée, le traitement des langues et l’analyse de textes, l’observation et la compréhension de l’univers, etc.

Fort d’une communauté large et visible au niveau international, l’INS2I est l’un des principaux partenaires des initiatives nationales lancées autour de l’IA, tant en ce qui concerne le pilotage scientifique, la structuration, que pour le développement d'infrastructures de calcul spécifiques à l’IA.

Pour animer la communauté scientifique de ses laboratoires, l’Institut a créé un groupement de recherche (GDR) sur les aspects fondamentaux de l’intelligence artificielle. Ce GDR, dirigé par Sébastien Konieczny, du Centre de Recherche en Informatique de Lens, participe également à veille scientifique et aux débats nationaux autour de l’intelligence artificielle.

 

Le site du GDR IA

Sébastien Konieczny : "Réunir la communauté IA par l’animation transversale de ce GdR"

La cyber-sécurité : une exigence pour préserver la liberté et la démocratie

Si le développement de la société numérique contribue au bien-être du citoyen et à la fluidité de ses échanges avec les pouvoirs publics et le secteur économique, la multiplication des canaux de communication (Internet des objets, maison connectée, voiture autonome, robots domestiques, capteurs ambiants…) introduit des fragilités qui peuvent menacer la vie privée et mettre en danger le secteur industriel et la puissance publique. L’INS2I est un acteur majeur dans la recherche et l’innovation sur la protection des données, la sécurité des réseaux et des transactions, la cryptographie et la lutte contre les intrusions dans les systèmes informatiques sensibles.

La communauté « sécurité » française est actuellement segmentée en différentes sous-communautés dotées d’autant d’instruments d’animation différents. Dans ce contexte, le GDR Sécurité doit permettre de rassembler une communauté scientifique unifiée autour de tous les aspects de la sécurité informatique, tels que la cryptologie et le codage, la vérification, les questions de vie privée, l’étude des vulnérabilités et des mécanismes de protection, la sécurité matérielle, etc.

Le site du GDR Sécurité Informatique

Gildas Avoine : "C’est à la communauté de s’approprier ce GDR Sécurité"

Le traitement automatique des langues naturelles : l'acteur numérique au cœur de la communication humaine

Le traitement automatique des langues s'intéresse à la modélisation et la reproduction, à l'aide de machines, des capacités humaines de production et de compréhension d'énoncés langagiers. Traduction automatique, assistants vocaux et systèmes de dialogue écrit, moteurs de recherche permettant une recherche d'information dans des collections de documents ou de pages web sont certaines des applications grand public phares de ce domaine. Avec l'amplification de la présence et du rôle du numérique dans tous les aspects de notre vie, le traitement automatique des langues est sur le devant de la scène. Il doit proposer des modèles, élaborer des algorithmes, construire des ressources pour produire des applications qui seront plus robustes, plus compréhensibles par les utilisateurs, plus aptes à intégrer conjointement les diverses modalités langagières (écrit, oral, geste, regard, expressions faciales...) et à prendre en compte la multiplicité des langues.

À travers le GDR TAL, l'INS2I accompagne et soutient le traitement automatique des langues dans son développement et ses recherches. Ce GDR a vocation à rassembler dans un esprit interdisciplinaire les communautés de la langue écrite, de la langue orale, de la langue signée et de la recherche d'information, tout en s'ouvrant aux sciences cognitives et au traitement d'images et de vidéos afin de pouvoir aborder la langue et la communication sous toutes leurs formes. La convergence des modèles et des algorithmes, des préoccupations communes concernant l'explicabilité des méthodes employées doivent permettre d'être à l'origine d'applications langagières éthiques que la société attend pour la santé, l'éducation, le droit, le patrimoine, et plus largement pour tous ses secteurs.

Le site du GDR TAL

Béatrice Daille : « La communauté TAL était prête et attendait ce préGDR »

Plateformes

L'Institut conduit des actions pérennes de structuration de la communauté nationale de recherche en sciences de l’information, notamment grâce aux plateformes de recherche.

L’INS2I garantit un accès à des moyens de recherche performants, tant matériels que logiciels, à travers le développement de plateformes de recherche mutualisées et dotées de personnels de support.

Exemples de plateformes soutenues par l'Institut

Continuum

Continuum vise à créer une « continuité collaborative du numérique vers l’humain » en développant des recherches interdisciplinaires entre l’informatique et les sciences humaines et sociales. Le projet rassemble des équipements tels que d’immenses murs d’écrans, des salles immersives et des casques de réalité virtuelle ou augmentée, répartis entre 30 plateformes. Ces équipements servent en particulier à la visualisation de données scientifiques complexes, ainsi qu’à façonner des environnements virtuels, par exemple pour étudier et guérir des phobies ou pour concevoir des reconstitutions historiques. On compte au total 37 équipes, issues de 22 partenaires dont le CNRS, qui porte le projet, le CEA et Inria, mais aussi 10 universités et 9 grandes écoles.

Continuum se place dans la lignée des Equipex Digiscope, IrDIVE et Kinovis, et la plupart de ses plateformes fonctionnent déjà. Les financements seront donc alloués à leur amélioration ainsi qu’à leur mise en réseau afin de fluidifier les communications et le travail collaboratif à distance. Le programme vise également à acquérir des équipements mobiles, qui faciliteront l’accès à ces outils par des équipes extérieures. Fixés avant le début de l’épidémie, ces objectifs trouvent aujourd’hui un écho particulièrement important. Un troisième axe s’attachera au déploiement de biocapteurs et de différents systèmes de capture de mouvements, pour créer des interfaces adaptées à la manipulation de données complexes et à la perception humaine. Enfin, cinq ingénieurs seront recrutés pour assurer les développements techniques, la maintenance des plateformes et de leurs réseaux, et l’accès par les usagers.

Continuum est un « équipement d’excellence » financé dans le cadre des investissements d’avenir.

TIRREX

TIRREX (pour Technological Infrastructure for Robotics Research of Excellence, Infrastructure Technologique pour la Recherche d’Excellence en Robotique) va coordonner au niveau national le développement et l’accès à de nouvelles plateformes emblématiques de robotique. Les grands acteurs de la recherche robotique (CNRS, Inria, CEA et INRAE) sont rassemblés dans ce projet, qui s’articule autour de six axes thématiques et de trois axes transverses. Aux côtés du prototypage et de la conception, ainsi que de la manipulation, le troisième axe transverse se concentrera sur des infrastructures ouvertes, afin de garantir et de normaliser l’accès à des données, des logiciels et des publications libres (jumeaux numériques, FAIR data et logiciels open source). L’infrastructure TIRREX, soutenue par plus de 50 entreprises ou réseaux d’entreprises, permettra à la communauté académique, dont notamment les membres du Groupement de Recherche (GDR) Robotique, d’accéder aux équipements de haut niveau et d’envergure internationale.

TIRREX est composé de six axes thématiques, dont un consacré à la robotique humanoïde. L’axe robotique XXL s’intéresse à la manipulation d’objets de grande dimension, un nouveau domaine de recherche où la France est pionnière. L’axe Micro-Nano robotique vise à développer des méthodes automatisées pour manipuler et caractériser des objets de moins de 10 µm, comme des cellules biologiques. L’axe de robotique aérienne propose d’homogénéiser des prototypes de drones, afin d’optimiser les ressources nationales. L’axe robots terrestres autonomes concerne les véhicules intelligents et des robots mobiles agricoles. Enfin, l’axe robotique médicale va intégrer la dernière génération de robots chirurgicaux flexibles, associée à des équipements satellitaires.

TIRREX est un « équipement d’excellence » financé dans le cadre des investissements d’avenir.

FITS

La recherche scientifique, tout comme différents autres domaines, fait face à une véritable explosion de la volumétrie des données générées. Certaines expériences, utilisant des instruments scientifiques ou des simulations numériques, vont produire jusqu’à des exaoctets de données, soit des milliards de gigaoctets. Le projet FITS veut répondre à ce défi en fédérant les services et le savoir-faire des deux grands centres informatiques du CNRS : l’IDRIS (Institut du développement et des ressources en informatique scientifique) et le CC-IN2P3 (Centre de calcul de l’Institut national de physique nucléaire et de physique des particules). Il permettra un stockage mutualisé à grande échelle, pérenne, souverain et sécurisé de ces données. Celles-ci seront ensuite traitées, grâce à des algorithmes qui identifient des signaux faibles qui échapperaient aux scientifiques. Ces données et les résultats associés seront enfin facilement accessibles, interopérables et réutilisables.

Pour cela, l’IDRIS apporte son expertise en intelligence artificielle et ses capacités de calcul haute performance, en particulier grâce au supercalculateur Jean Zay, le plus puissant de France, géré par GENCI (Grand équipement national de calcul intensif). Le CC-IN2P3 maîtrise lui parfaitement le traitement et l’analyse de grandes masses de données, des compétences acquises au fil de ses participations à de nombreuses expériences internationales en physique des hautes énergies. La puissance de calcul étant déjà assurée, les investissements vont essentiellement être réalisés pour déployer de nouveaux services de stockage hiérarchisé tout en minimisant l’empreinte carbone en modernisant les infrastructures d’hébergement. Afin de mutualiser ces éléments, les logiciels utilisés vont devoir être repensés. FITS sera utilisé dans un premier temps par le synchrotron Soleil, le grand relevé Legacy Survey of Space and Time (LSST) de l'observatoire Rubin, le Large Hadron Collider (LHC) et enfin l’Institut Français de Bio-informatique.

FITS est un « équipement d’excellence » financé dans le cadre des investissements d’avenir.

Années thématiques

Les années thématiques constituent un autre instrument de pilotage scientifique de l’INS2I.

Depuis 2015, l’INS2I met l’accent chaque année sur une thématique majeure en prise avec les grands enjeux de société. Cette démarche implique notamment le recrutement de chercheurs et le lancement d’un appel à projet exploratoire premier soutien (PEPS) en lien avec la thématique retenue, ainsi que la communication vers le grand public via des articles ou des ouvrages de vulgarisation.

2019 - Sciences de l’information et santé

Dans notre monde numérique, les sciences de l’information jouent un rôle de premier plan dans nombres de domaines, en particulier dans le domaine de la santé. Ainsi pour se limiter à quelques exemples :

  • la médecine de demain s’appuiera sur la science des données pour analyser des masses de données hétérogènes concernant les pathologies, les patients, la génomique, etc. pour proposer une approche personnalisée, préventive, prédictive et participative ;
  • l’imagerie médicale classique (EEG, IRM, échographie) s’enrichit régulièrement avec des nouvelles techniques, plus précises, plus rapides allant vers l’imagerie 3D ou 4D ;
  • la robotique devient une aide précieuse pour le chirurgien.

Bien évidemment, le développement de ces nouvelles approches requiert des travaux de recherche pluridisciplinaire mettant en jeu des chercheurs en sciences de l’information, les sciences biologiques et médicales.

L’année thématique et quelques-unes de ses différentes facettes seront illustrées par deux colloques ouverts à la société et trois conférences scientifiques, en 2019 et début 2020.

2018 - Sciences de l’information en interaction avec l’Humain

L’objectif de cette année thématique est de mettre l’accent sur le caractère primordial de l’intégration des facteurs humains dans le développement des systèmes numériques. Comment l’Humain est-il pris en compte dans la conception, le contrôle, la sécurité, le fonctionnement et l’évolution de ces systèmes ? Comment modéliser et organiser la répartition des tâches et les interactions entre humains et systèmes autonomes ? Ces questions, centrales pour l’INS2I, ont un caractère interdisciplinaire : elles concernent notamment les sciences humaines et sociales et les sciences du vivant.

L'année thématique a donné à un colloque ouvert à la société : Humain et numérique en interaction.

2017 - Objets communicants

Les objets communicants peuplent de plus en plus notre quotidien : smartphones, voitures, dispositifs de suivi d’activité physique, etc. Les données qu’ils captent, produisent et échangent, font l’objet de multiples enjeux technologiques et scientifiques, tout comme leurs contraintes spécifiques en matière de performances, de consommation énergétique et de sécurité. Les recherches dans ce domaine font naturellement appel à toute la palette des thématiques relevant de l’INS2I.

2016 - Sécurité informatique

La sécurité apparaît sous de multiples formes à l’intérieur du périmètre scientifique des sciences de l’information : cryptologie, vérification, protocoles de communication, vulnérabilités, protection des données personnelles, recherche de signaux faibles, sécurité matérielle notamment dans les systèmes embarqués, sûreté de fonctionnement, tatouage d’image et de signal, etc.

L'année thématique a donné à un colloque ouvert à la société : Sécurité informatique : mythes et réalité. Retrouvez les vidéos des interventions du colloque sur le site du GdR Sécurité.

2015 - Science des données

Les avancées technologiques sur le stockage et l’indexation de données, l’accès à des sources de données hétérogènes et massivement distribuées, l’optimisation de ces accès à l’aide d’architectures parallèles, et le haut débit des réseaux rendent possibles la fouille et l’analyse de données dans des échelles de temps acceptables. Cette année thématique a été l’occasion d’initier un projet éditorial qui s’est concrétisé en mars 2017 avec la parution de l’ouvrage collaboratif « Les Big Data à découvert » (CNRS Éditions).

Projets interdisciplinaires

L’INS2I a lancé des actions interdisciplinaires avec les autres instituts du CNRS, à travers des initiatives bilatérales ou au sein de la Mission pour les initiatives transverses et interdisciplinaires.

L’INS2I a notamment piloté deux grands défis sur les big data et la science des données (défi Mastodons) et sur le traitement d’images (défi Imag’In).

Voir le site de la MITI

Défi Grande masses de données scientifiques (Mastodons)

Action interdisciplinaire emblématique lancée en 2012, le défi Mastodons porte sur le traitement et l’exploitation de données multisources. Il a donné lieu à 22 projets de recherche et à plus de 100 publications. Des résultats significatifs ont été enregistrés en séquençage et phénotypage génomiques haut débit, en analyse de réseaux sociaux et en optimisation de requêtes sur des données astronomiques.

En savoir plus sur Mastodons

Défi Nouvelles méthodes en imagerie (Imag’In)

Depuis 2015, le défi Imag’In s’adresse aux spécialistes des capteurs et des systèmes d’imagerie complexes, aux experts du traitement de l’information et à ceux des domaines d’application. Leur collaboration permettra l’émergence de nouvelles méthodes d'imagerie destinés à de multiples domaines : physique, chimie, biologie, médecine, sciences de la Terre et de l’Univers, géographie, archéologie, etc.

En savoir plus sur Imag’In