Outils

Agenda de l'ENS de Lyon

Ordonnancement pour les bases de données clé-valeur

Date
jeu 28 sep 2023
Horaires

9h30

Lieu(x)

Amphi K

Intervenant(s)

Soutenance de M. DUGOIS Anthony sous la direction de M. MARCHAL Loris

Organisateur(s)
Langue(s) des interventions
Description générale

Les bases de données distribuées de type clé-valeur, où chaque entrée est associée à une clé de partition unique, sont des composants centraux des architectures modernes, notamment grâce à leurs propriétés de passage à l’échelle et de tolérance aux pannes. 
Étant donnée leur versatilité, ces systèmes doivent disposer des performances suffisantes pour assurer le service d’énormes quantités de requêtes. En particulier, le débit et la latence dépendent d’une grande diversité de facteurs. Dans cette thèse, nous nous intéressons à l’ordonnancement des requêtes au sein du cluster, avec l’objectif d’obtenir des garanties théoriques sur les fonctions objectives propres à ces systèmes. Nous modélisons ce problème d’ordonnancement dans le premier travail en prenant en compte la réplication des données, qui implique une contrainte spatiale forte sur l’exécution des requêtes, et l’aspect temps réel, qui empêche la connaissance a priori de la charge de travail. À partir de ce cadre théorique, nous développons plusieurs résultats d’optimalité et d’approximation pour des variantes simplifiées, et nous bornons la latence maximale pondérée en nous basant sur un algorithme optimal de l’état de l’art. Le calcul de cette borne inférieure nous permet d’évaluer la qualité de plusieurs heuristiques à partir de simulations. Le second travail porte sur des résultats d’inapproximabilité, et nous montrons que ceux-ci dépendent de la stratégie de réplication des données utilisée au sein du système. Nous donnons en outre une méthode permettant de calculer le débit maximal théoriquement atteignable sous un régime fixé de fréquence d’accès aux données. Le troisième travail est dédié à l’optimisation de l’exécution des requêtes dites multi-get, qui permettent de lire plusieurs clés à la fois. 
Dans le dernier travail, nous proposons Hector, un framework basé sur le système Apache Cassandra permettant de faciliter l’implémentation et l’évaluation des algorithmes d’ordonnancement en pratique.

Gratuit

Mots clés

Disciplines