20150318 / Prochaine coupure éléctrique - Next main power outage

Bonjour a tous,

Pour info, la prochaine coupure electrique generale pour l'ENS lyon est prevue le samedi 18 avril 2015.

Nous allons profiter de cette coupure pour realiser les operations suivantes :

  • Arret definitif des monointeldeb8 (72 coeurs) : Machines obsoletes, mauvais rapport performance / thermique, faible memoire
  • Augmentation de la capacité du /scratch/e5-2670-gfs-scratch (global E5-26xx). Cette operation risquant d'etre destructive, nous vous recommandons de recuperer vos fichiers importants AVANT la coupure
  • Upgrade mineur de l'OS des noeuds de calculs (debian 7.6 → 7.8)
  • Ajout d'une frontale de /home et redistribution des /home entre les frontales, operation transparente pour vous.
  • Migration d'OS (Centos → Debian) des noeuds de calculs sl390 en 48G, changement du nom de la queue (sl390lin48ib → x5672deb48) et acces au /scratch/x5570-gfs-scratch du cluster x55* et x56*
  • Modification du noms des queues courtes E5-2670 : E5-2670deb64d3 en E5-2670d3deb64, E5-2670deb64h3 en E5-2670h3deb64 et E5-2670deb64gpu* en E5-2670gpu*deb64. Vous pourrez maintenant soumettre a E5-2670deb64* sans risquer d'etre sur un noeud a duree courte (3 heures ou 3 jours)
  • Deplacement physique des r815, des sl230 et des c8220gpu (equilibrage thermique et electrique)
  • Nettoyage du circuit de refroidissement primaire (a partir du lundi 20/04)

Le planning prevu pour les arrets est donc le suivant :

  • arret des noeuds monoinetldeb8 le mardi 7 Avril
  • arret des queues sl390lin48ib, r815* et E5-2670deb64gpu* le mercredi 15/04 au soir (~17h)
  • arret de la queue E5-2670deb64nl (sl230) et des 4 compilateurs E5-2670comp[1-4] le jeudi 16/04 au soir (~17h)

FAITES VOS COPIES DEPUIS LE SCRATCH AVANT !!

  • arret de toutes les autres queues dans la matinee du vendredi 17/04 (avant 11h)
  • arret de la frontale allo-psmn à 11h vendredi 17/04

Le planning de redemarrage dependra de l'avancee du nettoyage des circuits de refroidissement (au mieux, a partir de mardi 21/04)

English version:

Hi all,

FYI, next planified main power outage for ENS lyon is scheduled for Saturday, April 18th 2015.

We will use this outage to (as usual) break everything^W^W realize the following:

  • Definitive stop of monointeldeb8 (72 cores): Obsolete, bad performance / thermal ratio, low memory
  • Size increase of /scratch/e5-2670-gfs-scratch (global E5-26xx). As this may be a destructive operation, we recommand saving your important files BEFORE the outage
  • Minor upgrade on compute nodes OS (debian 7.6 → 7.8)
  • Addition of a /home server and rebalance of /homes between servers
  • OS migration (Centos → Debian) for nodes sl390-48G, queue name change (sl390lin48ib → x5672deb48) and connection to /scratch/x5570-gfs-scratch
  • Name modification for short E5-2670 queues (E5-2670deb64d3 to E5-2670d3deb64, E5-2670deb64h3 to E5-2670h3deb64 and E5-2670deb64gpu* to E5-2670gpu*deb64). You will be able to submit to E5-2670deb64* without running on a short limit walltime node (3 hours or 3 days)
  • Physical move of r815, sl230 and c8220gpu (thermal and electrical balance)
  • Heavy cleaning on primary cooling circuit (start on Monday, April 20th)

Planned stops are :

  • stop of monointeldeb8 nodes on Tuesday, April 7th
  • stop of sl390lin48ib, r815* and E5-2670deb64gpu* queues on Wednesday, April 15th (~17h)
  • stop of E5-2670deb64nl (sl230) and E5-2670comp[1-4] compiler machines on Thursday, April 16th (~17h)

MAKE COPY FROM THE SCRATCH BEFORE!!

  • stop of all remaining queues on Friday, April 17th (before 11h)
  • stop of allo-psmn at 11h on Friday, April 17th

Scheduling of restart will depend on primary cooling circuit cleaning operations (at best, beginning Tuesday, April 21th)

Best regards, PSMN Staff

newsfeed/20150318.txt · Dernière modification: 2020/08/25 17:58 (modification externe)