S'abonner au fil des news (flux RSS)
2 disks in FAILED mode on E5 scratch. Rebuild in progress.
Une baie de disque du scratch E5 est morte. Le SAV est en cours.
EDIT 12/04/2018: rebuild in progress…
EDIT 12/04/2018: rebuild terminé.
Un arrêt total de l'alimentation électrique a eu lieu le dimanche 01/04 vers 18h00. La cause en est actuellement inconnue
EDIT 2018/04/02 : Ce n'était pas un poisson d'Avril. Il y a réellement eu une panne électrique.
Tous les noeuds de calculs ont du être redémarrés. Les jobs ont été perdus.
Le /scratch E5 est très fortement perturbé, nous travaillons à résoudre le problème.
We are struggling to install stable and reliable versions of compilers (gcc, intel, PGI) and OpenMPI.
On advices from other HPC centers, we choose to try to use an automated builder system (easybuild), which “should” help us, when installing/upgrading softwares.
As it's designed for HPC, it's extremely configurable (a lot, too much), and it's very easy to make mistakes that propagates into the softwares tree. It's highly integrated with l-mod (the new environment modules manager), as it automagically create (or erase) the modulefiles. More magically propagation of errors…
That's why the ml avail
change a lot these days.
We will propose an “Out of the softwares tree” with intel and openmpi reliables versions ASAP.