Outils

Agenda de l'ENS de Lyon

Fault-tolerant and energy-aware algorithms for workflows and real-time systems

Date
lun 06 avr 2020
Horaires

14h00

Intervenant(s)

Soutenance de thèse de Mme Li HAN du LIP, sous la direction de M. Yves ROBERT

Organisateur(s)
Langue(s) des interventions
Description générale

Cette thèse se concentre sur deux problèmes majeurs dans le contexte du calcul haute performance: la résilience et la consommation d'énergie.

Le nombre d'unités de calcul dans les superordinateurs a considérablement augmenté ces dernières années, entraînant une augmentation de la fréquence des pannes. Le recours à des mécanismes de tolérance aux pannes est maintenant critique pour les applications utilisant un grand nombre de composants pendant une période de temps significative. Il est par ailleurs nécessaire de minimiser la consommation énergétique pour des raisons budgétaires et environnementales. Ceci est d'autant plus important que la tolérance aux pannes nécessite une redondance en temps ou en espace qui induit un surcoût énergétique. Par ailleurs, certaines technologies qui réduisant la consommation d'énergie ont des effets négatifs sur les performances et la résilience.

Nous concevons des algorithmes d'ordonnancement pour étudier les compromis entre performance, résilience et consommation d'énergie. Dans une première partie nous nous concentrons sur l'ordonnancement des graphes de tâches sujets à des pannes. La question est alors de décider quelle tâche sauvegarder afin de minimiser le temps d'exécution. Nous concevons des solutions optimales pour des classes de graphes et fournissons des heuristiques pour le cas général. Nous considérons dans une deuxième partie l'ordonnancement de tâches périodiques indépendantes sujettes à des erreurs silencieuses dans un contexte temps-réel. Nous étudions combien de réplicats sont nécessaires et l'interaction entre dates butoir, fiabilité, et minimisation d'énergie.
 

Gratuit

Mots clés

Disciplines