====== 20150318 / Prochaine coupure éléctrique - Next main power outage ====== Bonjour a tous, Pour info, la prochaine coupure electrique generale pour l'ENS lyon est prevue le samedi 18 avril 2015. Nous allons profiter de cette coupure pour realiser les operations suivantes : * Arret definitif des monointeldeb8 (72 coeurs) : Machines obsoletes, mauvais rapport performance / thermique, faible memoire * Augmentation de la capacité du /scratch/e5-2670-gfs-scratch (global E5-26xx). Cette operation risquant d'etre destructive, nous vous recommandons de recuperer vos fichiers importants **AVANT** la coupure * Upgrade mineur de l'OS des noeuds de calculs (debian 7.6 -> 7.8) * Ajout d'une frontale de /home et redistribution des /home entre les frontales, operation transparente pour vous. * Migration d'OS (Centos -> Debian) des noeuds de calculs sl390 en 48G, changement du nom de la queue (sl390lin48ib -> x5672deb48) et acces au /scratch/x5570-gfs-scratch du cluster x55* et x56* * Modification du noms des queues courtes E5-2670 : E5-2670deb64d3 en E5-2670d3deb64, E5-2670deb64h3 en E5-2670h3deb64 et E5-2670deb64gpu* en E5-2670gpu*deb64. Vous pourrez maintenant soumettre a E5-2670deb64* sans risquer d'etre sur un noeud a duree courte (3 heures ou 3 jours) * Deplacement physique des r815, des sl230 et des c8220gpu (equilibrage thermique et electrique) * Nettoyage du circuit de refroidissement primaire (a partir du lundi 20/04) Le planning prevu pour les arrets est donc le suivant : * arret des noeuds monoinetldeb8 le mardi 7 Avril * arret des queues sl390lin48ib, r815* et E5-2670deb64gpu* le mercredi 15/04 au soir (~17h) * arret de la queue E5-2670deb64nl (sl230) et des 4 compilateurs E5-2670comp[1-4] le jeudi 16/04 au soir (~17h) **FAITES VOS COPIES DEPUIS LE SCRATCH AVANT !!** * arret de toutes les autres queues dans la matinee du vendredi 17/04 (avant 11h) * arret de la frontale allo-psmn à 11h vendredi 17/04 Le planning de redemarrage dependra de l'avancee du nettoyage des circuits de refroidissement (au mieux, a partir de mardi 21/04) **English version:** Hi all, FYI, next planified main power outage for ENS lyon is scheduled for Saturday, April 18th 2015. We will use this outage to (as usual) break everything^W^W realize the following: * Definitive stop of monointeldeb8 (72 cores): Obsolete, bad performance / thermal ratio, low memory * Size increase of /scratch/e5-2670-gfs-scratch (global E5-26xx). As this may be a destructive operation, we recommand saving your important files **BEFORE** the outage * Minor upgrade on compute nodes OS (debian 7.6 -> 7.8) * Addition of a /home server and rebalance of /homes between servers * OS migration (Centos -> Debian) for nodes sl390-48G, queue name change (sl390lin48ib -> x5672deb48) and connection to /scratch/x5570-gfs-scratch * Name modification for short E5-2670 queues (E5-2670deb64d3 to E5-2670d3deb64, E5-2670deb64h3 to E5-2670h3deb64 and E5-2670deb64gpu* to E5-2670gpu*deb64). You will be able to submit to E5-2670deb64* without running on a short limit walltime node (3 hours or 3 days) * Physical move of r815, sl230 and c8220gpu (thermal and electrical balance) * Heavy cleaning on primary cooling circuit (start on Monday, April 20th) Planned stops are : * stop of monointeldeb8 nodes on Tuesday, April 7th * stop of sl390lin48ib, r815* and E5-2670deb64gpu* queues on Wednesday, April 15th (~17h) * stop of E5-2670deb64nl (sl230) and E5-2670comp[1-4] compiler machines on Thursday, April 16th (~17h) **MAKE COPY FROM THE SCRATCH BEFORE!!** * stop of all remaining queues on Friday, April 17th (before 11h) * stop of allo-psmn at 11h on Friday, April 17th Scheduling of restart will depend on primary cooling circuit cleaning operations (at best, beginning Tuesday, April 21th) Best regards, PSMN Staff {{tag> hard soft batch }}