Soutenance de thèse: Marie Paindavoie, vendredi 27 janvier 2017 à 10h dans la salle des thèses du site Monod de l'ENS Lyon : Méthodes de calcul sur les données chiffrées.

 

Le jury sera composé de :
Sébastien Canard (Orange Labs) - directeur de thèse
Céline Chevalier (Université Paris 2) - examinatrice
Caroline Fontaine (Telecom Bretagne) - rapporteure
Fabien Laguillaumie (Université Lyon 1) - directeur de thèse
Marine Minier (Université de Lorraine) - examinatrice
Traian Muntean (Université Aix-Marseille) - examinateur
Melek Önen (Eurecom) - examinatrice
Duong-Hieu Phan (Université de Limoges) - rapporteur

La soutenance sera en français, avec un support en anglais.

Résumé (english version below)
L’annonce de l’essor du chiffrement des données se heurte à celle de l’avènement du "big data". Il n’est maintenant plus suffisant d’envoyer et de recevoir des données, il faut pouvoir les analyser, les exploiter ou encore les partager à grande échelle. Or, les données à protéger sont de plus en plus nombreuses, notamment avec la prise de conscience de l’impact qu’ont les nouvelles technologies (smartphones, internet of things, cloud…) sur la vie privée des utilisateurs. En rendant ces données inaccessibles, le chiffrement bloque a priori les fonctionnalités auxquelles les utilisateurs et les fournisseurs de service sont habitués. Pour rétablir ces fonctionnalités, il est nécessaire de savoir calculer des fonctions de données chiffrées, et cette thèse explore plusieurs pistes dans ce sens.

Dans une première partie, nous nous intéressons au chiffrement totalement homomorphe qui permet de réaliser des calculs arbitraires sur les données chiffrées. Ce type de chiffrement est cependant particulièrement coûteux, notamment à cause de l’appel souvent nécessaire à une procédure très coûteuse : le réamorçage. Nous prouvons ici que minimiser le nombre de réamorçages est un problème NP-complet et donnons une méthode pratique pour approximer ce minimum.

Dans une seconde partie, nous étudions des schémas dédiés à une fonctionnalité donnée. Le premier cas d’usage considéré est celui de la déduplication vérifiable de données chiffrées. Il s’agit pour un serveur de stockage externe d’être assuré qu’il ne conserve qu’un seul exemplaire de chaque fichier, même si ceux-ci sont chiffrés, ce qui lui permet d’optimiser l’usage de ses ressources mémoires.
Ensuite, nous proposons un schéma de chiffrement cherchable permettant de détecter des intrusions dans un réseau de télécommunications chiffrés. En effet, le travail d’inspection du réseau par des moteurs d’analyse est actuellement entravé par la croissance du trafic chiffré. Les résultats obtenus permettent ainsi d’assurer la confidentialité des échanges tout en garantissant l’absence d’intrusions malveillantes dans le trafic.

Abstract

Nowadays, encryption and services issued of "big data" are at odds. Indeed, encryption is about protecting users privacy, while big data is about analyzing users data. Being increasingly concerned about security, users tend to encrypt their sensitive data that are subject to be accessed by other parties, including service providers. This hinders the execution of services requiring some kind of computation on users data, which makes users under obligation to choose between these services or their private life. We address this challenge in this thesis by following two directions.

In the first part of this thesis, we study fully homomorphic encryption that makes possible to perform arbitrary computation on encrypted data. However, this kind of encryption is still inefficient, and this is due in part to the frequent execution of a costly procedure throughout evaluation, namely the bootstrapping. Thus, efficiency is inversely proportional to the number of bootstrappings needed to evaluate functions on encrypted data. In this thesis, we prove that finding such a minimum is NP-complete. In addition, we design a new method that efficiently finds a good approximation of it.

In the second part, we design schemes that allow a precise functionality. The first one is verifiable deduplication on encrypted data, which allows a server to be sure that it keeps only one copy of each file uploaded, even if the files are encrypted, resulting in an optimization of the storage resources. The second one is intrusion detection over encrypted traffic. Current encryption techniques blinds intrusion detection services, putting the final user at risks. Our results permit to reconcile users' right to privacy and their need of keeping their network clear of all intrusion.