Ceci est une ancienne révision du document !


20150318 / Prochaine coupure éléctrique - Next main power outage

Bonjour a tous,

Pour info, la prochaine coupure electrique generale pour l'ENS lyon est prevue le samedi 18 avril 2015.

Nous allons profiter de cette coupure pour realiser les operations suivantes :

  1. Arret definitif des monointeldeb8 (72 coeurs) : Machines obsoletes, mauvais rapport performance / thermique, faible memoire
  2. Augmentation de la capacité du /scratch/e5-2670-gfs-scratch (global E5-26xx). Cette operation risquant d'etre destructive, nous vous recommandons de recuperer vos fichiers importants AVANT la coupure
  3. Upgrade mineur de l'OS des noeuds de calculs (debian 7.6 → 7.8)
  4. Ajout d'une frontale de /home et redistribution des /home entre les frontales, operation transparente pour vous.
  5. Migration d'OS (Centos → Debian) des noeuds de calculs sl390 en 48G, changement du nom de la queue (sl390lin48ib → x5672deb48) et acces au /scratch/x5570-gfs-scratch du cluster x55* et x56*
  6. Modification du noms des queues courtes E5-2670 : E5-2670deb64d3 en E5-2670d3deb64, E5-2670deb64h3 en E5-2670h3deb64 et E5-2670deb64gpu* en E5-2670gpu*deb64. Vous pourrez maintenant soumettre a E5-2670deb64* sans risquer d'etre sur un noeud a duree courte (3 heures ou 3 jours)
  7. Deplacement physique des r815, des sl230 et des c8220gpu (equilibrage thermique et electrique)
  8. Nettoyage du circuit de refroidissement primaire (a partir du lundi 20/04)

Le planning prevu pour les arrets est donc le suivant :

  1. arret des noeuds monoinetldeb8 le mardi 7 Avril
  2. arret des queues sl390lin48ib, r815* et E5-2670deb64gpu* le mercredi 15/04 au soir (~17h)
  3. arret de la queue E5-2670deb64nl (sl230) et des 4 compilateurs E5-2670comp[1-4] le jeudi 16/04 au soir (~17h)

FAITES VOS COPIES DEPUIS LE SCRATCH AVANT !!

  1. arret de toutes les autres queues dans la matinee du vendredi 17/04 (avant 11h)
  2. arret de la frontale allo-psmn à 11h vendredi 17/04

Le planning de redemarrage dependra de l'avancee du nettoyage des circuits de refroidissement (au mieux, a partir de mardi 21/04)

English version:

Hi all,

FYI, next planified main power outage for ENS lyon is scheduled for Saturday, April 18th 2015.

We will use this outage to (as usual) break everything^W^W realize the following:

  1. Definitive stop of monointeldeb8 (72 cores): Obsolete, bad performance / thermal ratio, low memory
  2. Size increase of /scratch/e5-2670-gfs-scratch (global E5-26xx). As this may be a destructive operation, we recommand saving your important files BEFORE the outage
  3. Minor upgrade on compute nodes OS (debian 7.6 → 7.8)
  4. Addition of a /home server and rebalance of /homes between servers
  5. OS migration (Centos → Debian) for nodes sl390-48G, queue name change (sl390lin48ib → x5672deb48) and connection to /scratch/x5570-gfs-scratch
  6. Name modification for short E5-2670 queues (E5-2670deb64d3 to E5-2670d3deb64, E5-2670deb64h3 to E5-2670h3deb64 and E5-2670deb64gpu* to E5-2670gpu*deb64). You will be able to submit to E5-2670deb64* without running on a short limit walltime node (3 hours or 3 days)
  7. Physical move of r815, sl230 and c8220gpu (thermal and electrical balance)
  8. Heavy cleaning on primary cooling circuit (start on Monday, April 20th)

Planned stops are :

  1. stop of monointeldeb8 nodes on Tuesday, April 7th
  2. stop of sl390lin48ib, r815* and E5-2670deb64gpu* queues on Wednesday, April 15th (~17h)
  3. stop of E5-2670deb64nl (sl230) and E5-2670comp[1-4] compiler machines on Thursday, April 16th (~17h)

MAKE COPY FROM THE SCRATCH BEFORE!!

  1. stop of all remaining queues on Friday, April 17th (before 11h)
  2. stop of allo-psmn at 11h on Friday, April 17th

Scheduling of restart will depend on primary cooling circuit cleaning operations (at best, beginning Tuesday, April 21th)

Best regards, PSMN Staff

newsfeed/20150318.1426674447.txt.gz · Dernière modification : 2020/08/25 15:58 (modification externe)