Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente |
newsfeed:20150318 [2015/03/18 10:27] – ltaulell | newsfeed:20150318 [2020/08/25 15:58] (Version actuelle) – modification externe 127.0.0.1 |
---|
Nous allons profiter de cette coupure pour realiser les operations suivantes : | Nous allons profiter de cette coupure pour realiser les operations suivantes : |
| |
- Arret definitif des monointeldeb8 (72 coeurs) : Machines obsoletes, mauvais rapport performance / thermique, faible memoire | * Arret definitif des monointeldeb8 (72 coeurs) : Machines obsoletes, mauvais rapport performance / thermique, faible memoire |
- Augmentation de la capacité du /scratch/e5-2670-gfs-scratch (global E5-26xx). Cette operation risquant d'etre destructive, nous vous recommandons de recuperer vos fichiers importants **AVANT** la coupure | * Augmentation de la capacité du /scratch/e5-2670-gfs-scratch (global E5-26xx). Cette operation risquant d'etre destructive, nous vous recommandons de recuperer vos fichiers importants **AVANT** la coupure |
- Upgrade mineur de l'OS des noeuds de calculs (debian 7.6 -> 7.8) | * Upgrade mineur de l'OS des noeuds de calculs (debian 7.6 -> 7.8) |
- Ajout d'une frontale de /home et redistribution des /home entre les frontales, operation transparente pour vous. | * Ajout d'une frontale de /home et redistribution des /home entre les frontales, operation transparente pour vous. |
- Migration d'OS (Centos -> Debian) des noeuds de calculs sl390 en 48G, changement du nom de la queue (sl390lin48ib -> x5672deb48) et acces au /scratch/x5570-gfs-scratch du cluster x55* et x56* | * Migration d'OS (Centos -> Debian) des noeuds de calculs sl390 en 48G, changement du nom de la queue (sl390lin48ib -> x5672deb48) et acces au /scratch/x5570-gfs-scratch du cluster x55* et x56* |
- Modification du noms des queues courtes E5-2670 : E5-2670deb64d3 en E5-2670d3deb64, E5-2670deb64h3 en E5-2670h3deb64 et E5-2670deb64gpu* en E5-2670gpu*deb64. Vous pourrez maintenant soumettre a E5-2670deb64* sans risquer d'etre sur un noeud a duree courte (3 heures ou 3 jours) | * Modification du noms des queues courtes E5-2670 : E5-2670deb64d3 en E5-2670d3deb64, E5-2670deb64h3 en E5-2670h3deb64 et E5-2670deb64gpu* en E5-2670gpu*deb64. Vous pourrez maintenant soumettre a E5-2670deb64* sans risquer d'etre sur un noeud a duree courte (3 heures ou 3 jours) |
- Deplacement physique des r815, des sl230 et des c8220gpu (equilibrage thermique et electrique) | * Deplacement physique des r815, des sl230 et des c8220gpu (equilibrage thermique et electrique) |
- Nettoyage du circuit de refroidissement primaire (a partir du lundi 20/04) | * Nettoyage du circuit de refroidissement primaire (a partir du lundi 20/04) |
| |
Le planning prevu pour les arrets est donc le suivant : | Le planning prevu pour les arrets est donc le suivant : |
- arret des noeuds monoinetldeb8 le mardi 7 Avril | * arret des noeuds monoinetldeb8 le mardi 7 Avril |
- arret des queues sl390lin48ib, r815* et E5-2670deb64gpu* le mercredi 15/04 au soir (~17h) | * arret des queues sl390lin48ib, r815* et E5-2670deb64gpu* le mercredi 15/04 au soir (~17h) |
- arret de la queue E5-2670deb64nl (sl230) et des 4 compilateurs E5-2670comp[1-4] le jeudi 16/04 au soir (~17h) | * arret de la queue E5-2670deb64nl (sl230) et des 4 compilateurs E5-2670comp[1-4] le jeudi 16/04 au soir (~17h) |
**FAITES VOS COPIES DEPUIS LE SCRATCH AVANT !!** | **FAITES VOS COPIES DEPUIS LE SCRATCH AVANT !!** |
- arret de toutes les autres queues dans la matinee du vendredi 17/04 (avant 11h) | * arret de toutes les autres queues dans la matinee du vendredi 17/04 (avant 11h) |
- arret de la frontale allo-psmn à 11h vendredi 17/04 | * arret de la frontale allo-psmn à 11h vendredi 17/04 |
| |
Le planning de redemarrage dependra de l'avancee du nettoyage des circuits de refroidissement (au mieux, a partir de mardi 21/04) | Le planning de redemarrage dependra de l'avancee du nettoyage des circuits de refroidissement (au mieux, a partir de mardi 21/04) |
| |
We will use this outage to (as usual) break everything^W^W realize the following: | We will use this outage to (as usual) break everything^W^W realize the following: |
- Definitive stop of monointeldeb8 (72 cores): Obsolete, bad performance / thermal ratio, low memory | * Definitive stop of monointeldeb8 (72 cores): Obsolete, bad performance / thermal ratio, low memory |
- Size increase of /scratch/e5-2670-gfs-scratch (global E5-26xx). As this may be a destructive operation, we recommand saving your important files **BEFORE** the outage | * Size increase of /scratch/e5-2670-gfs-scratch (global E5-26xx). As this may be a destructive operation, we recommand saving your important files **BEFORE** the outage |
- Minor upgrade on compute nodes OS (debian 7.6 -> 7.8) | * Minor upgrade on compute nodes OS (debian 7.6 -> 7.8) |
- Addition of a /home server and rebalance of /homes between servers | * Addition of a /home server and rebalance of /homes between servers |
- OS migration (Centos -> Debian) for nodes sl390-48G, queue name change (sl390lin48ib -> x5672deb48) and connection to /scratch/x5570-gfs-scratch | * OS migration (Centos -> Debian) for nodes sl390-48G, queue name change (sl390lin48ib -> x5672deb48) and connection to /scratch/x5570-gfs-scratch |
- Name modification for short E5-2670 queues (E5-2670deb64d3 to E5-2670d3deb64, E5-2670deb64h3 to E5-2670h3deb64 and E5-2670deb64gpu* to E5-2670gpu*deb64). You will be able to submit to E5-2670deb64* without running on a short limit walltime node (3 hours or 3 days) | * Name modification for short E5-2670 queues (E5-2670deb64d3 to E5-2670d3deb64, E5-2670deb64h3 to E5-2670h3deb64 and E5-2670deb64gpu* to E5-2670gpu*deb64). You will be able to submit to E5-2670deb64* without running on a short limit walltime node (3 hours or 3 days) |
- Physical move of r815, sl230 and c8220gpu (thermal and electrical balance) | * Physical move of r815, sl230 and c8220gpu (thermal and electrical balance) |
- Heavy cleaning on primary cooling circuit (start on Monday, April 20th) | * Heavy cleaning on primary cooling circuit (start on Monday, April 20th) |
| |
| |
Planned stops are : | Planned stops are : |
- stop of monointeldeb8 nodes on Tuesday, April 7th | * stop of monointeldeb8 nodes on Tuesday, April 7th |
- stop of sl390lin48ib, r815* and E5-2670deb64gpu* queues on Wednesday, April 15th (~17h) | * stop of sl390lin48ib, r815* and E5-2670deb64gpu* queues on Wednesday, April 15th (~17h) |
- stop of E5-2670deb64nl (sl230) and E5-2670comp[1-4] compiler machines on Thursday, April 16th (~17h) | * stop of E5-2670deb64nl (sl230) and E5-2670comp[1-4] compiler machines on Thursday, April 16th (~17h) |
**MAKE COPY FROM THE SCRATCH BEFORE!!** | **MAKE COPY FROM THE SCRATCH BEFORE!!** |
- stop of all remaining queues on Friday, April 17th (before 11h) | * stop of all remaining queues on Friday, April 17th (before 11h) |
- stop of allo-psmn at 11h on Friday, April 17th | * stop of allo-psmn at 11h on Friday, April 17th |
| |
Scheduling of restart will depend on primary cooling circuit cleaning operations (at best, beginning Tuesday, April 21th) | Scheduling of restart will depend on primary cooling circuit cleaning operations (at best, beginning Tuesday, April 21th) |