S'abonner au fil des news (flux RSS)

Fil des news

20180417 / Scratch E5 degraded mode

2 disks in FAILED mode on E5 scratch. Rebuild in progress.

2018/04/17 12:03 · ltaulell

20180411 / Scratch E5 degraded

Une baie de disque du scratch E5 est morte. Le SAV est en cours.

EDIT 12/04/2018: rebuild in progress…

EDIT 12/04/2018: rebuild terminé.

2018/04/11 13:51 · ltaulell

20180401 / panne alimentation électricité

Un arrêt total de l'alimentation électrique a eu lieu le dimanche 01/04 vers 18h00. La cause en est actuellement inconnue

EDIT 2018/04/02 : Ce n'était pas un poisson d'Avril. Il y a réellement eu une panne électrique.

Tous les noeuds de calculs ont du être redémarrés. Les jobs ont été perdus.

2018/04/03 11:58 · ltaulell

20180309 / scratch

Le /scratch E5 est très fortement perturbé, nous travaillons à résoudre le problème.

2018/03/09 10:00 · gilquin

20180207 / Compilers vs OpenMPI

We are struggling to install stable and reliable versions of compilers (gcc, intel, PGI) and OpenMPI.

On advices from other HPC centers, we choose to try to use an automated builder system (easybuild), which “should” help us, when installing/upgrading softwares.

As it's designed for HPC, it's extremely configurable (a lot, too much), and it's very easy to make mistakes that propagates into the softwares tree. It's highly integrated with l-mod (the new environment modules manager), as it automagically create (or erase) the modulefiles. More magically propagation of errors…

That's why the ml avail change a lot these days.

We will propose an “Out of the softwares tree” with intel and openmpi reliables versions ASAP.

2018/02/07 11:27 · ltaulell
news/blog.txt · Dernière modification : 2020/08/25 15:58 de 127.0.0.1