Ceci est une ancienne révision du document !


~~NEWSFEED:5~~

S'abonner au fil des news (flux RSS)

~~NEWS_REFRESH~~

Les pannes et incidents

20130220

Problèmes sur des SL390 (sl390lin9, sl390lin118, sl390lin37 à 40). Elles ont été redémarrées, les jobs qui tournaient dessus ont été perdus.

20130218

r815

Problème sur l'infiniband des R815. Queues bloquées en attente du redémarrage du cluster et du switch infiniband.

20130124

r510data2

Un disque système est HS sur le serveur r510data2 (home de cbp, cecam, evs, geol, igfldb et ixxi). Le serveur parait inaccessible et plante tous les jobs qui lui sont liés.

20130114

r510data1

Changement d'un disque sur la baie de backup du serveur R510data1, seuls les utilisateurs de physique sont impactés.

20130107

sl390

Début d'incendie sur des sl390 (sl390lin33 à 40)

Photos : http://perso.ens-lyon.fr/lois.taulelle/HP-sl390/

news/hard_failure.1361379365.txt.gz · Dernière modification : 2020/08/25 15:58 (modification externe)