Outils

Agenda de l'ENS de Lyon

Scheduling algorithms to optimize the performance, energy consumption and robustness of HPC applications

Date
jeu 25 juin 2023
Horaires

15 heures

Lieu(x)

Amphi B

Intervenant(s)

Soutenance de M. PEROTIN Lucas sous la direction de Mme BENOIT Anne

Organisateur(s)
Langue(s) des interventions
Description générale

Cette thèse a pour objectif d’étudier différents problèmes liés à l’ordonnancement dans le contexte du calcul haute performance, en se concentrant sur deux enjeux majeurs : la résilience et la consommation d’énergie. Avec l’augmentation constante de la taille des machines de calcul et du nombre d’opérations par secondes, la gestion des erreurs et la consommation énergétique sont devenus des défis critiques.
La première partie de cette thèse explore la gestion d’erreurs silencieuses qui peuvent amener à la ré-exécution de tâches, ou à la variabilité du matériel qui peuvent obliger à interrompre des tâches. Dans un second temps, les mécanismes de sauvegarde d’états d’une application sont analysés afin d’éviter la ré-exécution complête des tâches. En effet, des approches sont proposées pour des stratégies de sauvegardes à l’échelle d’une seule tâche, puis étendues à des graphes de tâches complexes. Enfin, comme ces sauvegardes nécessitent de faire des phases de lectures/écritures, un travail a été réalisé sur l’étude d’algorithmes de partage de bande passante pour des applications utilisant le même nœud d’I/O.
Les travaux présentés dans cette thèse sont à la fois théoriques et expérimentaux, avec des bornes d’approximation théoriques, et des simulations visant à évaluer l’efficacité des approches proposées. Ces résultats sont présentés dans des conférences et des journaux scientifiques de haut niveau, et apportent des contributions à la recherche en calcul haute performance.

Gratuit

Mots clés

Disciplines