CryptAnalytics : une bourse ERC pour une cryptographie mieux adaptée au cloud

Distinctions International Informatique

Avec CryptAnalytics, David Pointcheval du laboratoire DI ENS (CNRS/ENS Paris/Inria) veut trouver de nouvelles applications pour le chiffrement fonctionnel multi-client. Cette technologie, qu’il a lui-même développée, offre la possibilité de réaliser des statistiques sur des données stockées sur un cloud, sans en compromettre la confidentialité.

Le succès du cloud n’est pas sans conséquence, toutes ces données stockées à distance doivent bénéficier d’une protection adaptée. David Pointcheval, directeur de recherche CNRS et directeur du Département d’informatique de l’École normale supérieure (DI ENS, CNRS/ENS Paris/Inria), travaille ainsi à des solutions de cryptographie qui sécurisent cette vague de dématérialisation. Le Conseil européen de la recherche vient d’accorder à son équipe un ERC Proof of concept (PoC), une bourse qui aide les scientifiques à valoriser et appliquer les résultats d’un précédent ERC.

« CryptAnalytics est le prolongement de CryptoCloud, que nous avons terminé il y a tout juste six mois, explique David Pointcheval. Ce premier projet visait à se servir de la cryptographie pour apporter de la confidentialité sur le cloud, un concept qui ne se limite pas au respect de la vie privée des utilisateurs, mais englobe également l’anonymat et le secret du traitement. De plus en plus de particuliers et d’entreprises externalisent leurs données sur un cloud, ils doivent pouvoir y accéder et les manipuler sans que l’hébergeur ou des inconnus n’apprennent d’information sensible. »

La plus grande avancée de CryptoCloud a été le développement du chiffrement fonctionnel multi-client. Il offre l’opportunité à un utilisateur de partager des données sur un cloud, en contrôlant ce que les autres en savent. Un système qui permet par exemple de mettre en ligne les notes d’une classe, en choisissant qui peut tout voir et qui n’a accès qu’à des moyennes ou des résultats par matière. Il est même possible d’obtenir des statistiques sur des valeurs entrées par des personnes indépendantes. Une autre partie importante est la « preuve zero-knowledge » : s’assurer qu’un calcul a été effectué correctement sur des données d’un cloud, par l’hébergeur, mais sans compromettre la confidentialité.

Nous parvenons à prouver sans rien révéler de ce que l’on prouve. 

« Imaginez des compagnies d’assurance qui voudraient mettre en commun les incidents ou sinistres de leurs clients, mais sans donner d’informations à leurs concurrents, prend comme exemple David Pointcheval. Le chiffrement fonctionnel multi-client permet d’obtenir des statistiques globales, sans rien révéler des données individuelles qui pourrait nuire à une des entreprises participantes. Nos travaux intéressent également le secteur boursier ainsi que le traitement de données médicales. C’est pour ce genre de cas d’usage que nous souhaitons les valoriser dans le cadre de l’ERC PoC. »

Dans cette nouvelle étape, David Pointcheval et son équipe seront accompagnés par la start-up Cosmian, spécialisée dans le traitement confidentiel des données. Ensemble, ils passeront ces travaux à une échelle plus importante, en vérifieront l’efficacité et sélectionneront les types de données qui se prêtent le mieux à ces technologies de cryptographie. Après avoir recruté un développeur, l’équipe devra également trouver, au cours des dix-huit mois que durera le projet ERC PoC, davantage de cas d’usage.

D’un point de vue plus technique, des défis cryptographiques devront aussi être relevés. Les algorithmes doivent en effet être protégés par des verrous algorithmiques difficiles à résoudre, et donc compliqués à outrepasser. Factorisation de grands entiers, logarithme discret dans des groupes variés, réseaux euclidiens… Chaque possibilité présente des avantages et inconvénients, qui devront être pesés lors de l’ERC.

« La taille des données que l’on manipule, ainsi que la manière dont elles sont utilisées, impacte ces choix, poursuit David Pointcheval. De grands objets sollicités en petites quantités à la fois seront traités différemment d’un très grand nombre de petites données. Des structures différentes sont mobilisées en fonction des situations, il faut trouver le bon compromis pour le passage à l’échelle. »

Contact