Ceci est une ancienne révision du document !
Il manque les variables suivantes dans votre environnement :
# Override PATH wide export PATH="/gridware/sge/bin/lx24-amd64:$PATH" # SGE exports export SGE_ROOT="/gridware/sge" export ARCH="lx24-amd64" export SGE_QMASTER_PORT="6444" export SGE_EXECD_PORT="6445" export SGE_CELL="default" export SGE_CLUSTER_NAME="psmn"
pour le shell bash :
source /usr/local/modeles/sge.sh
et pour le shell tcsh :
source /usr/local/modeles/sge.csh
L'un de vos scripts contient des lignes commençant par #$
(souvent une ligne de commentaires) qui est interprétée par SGE.
#$
est réservé à SGE pour effectuer des transmission de paramètres (ex: #$ -cwd
ou #$ -V
).
#$ -cwd #$ -V ${EXECDIR}/prog1 #${EXECDIR}/prog2
#$ -cwd #$ -V ${EXECDIR}/prog1 ##${EXECDIR}/prog2
Par les achats successifs de nœuds de calcul avec des architectures de générations différentes, il n'était pas possible de présenter une seule queue, il était préférable d'avoir des queues différentes pour chaque architecture, afin d'atteindre des performances intéressantes pour chaque queue.
Concrètement le choix de la queue de “production” devrait se faire en fonction de l'objectif voulu :
qstat -g c
devraient être la base de ce choix. Évidemment, la commande ci-dessus et la page web qui détaille les ressources par queue devraient guider le choix de la queue.
Et bien sur, pour la mise au point du code, il faut choisir une queue de test qui soit la plus proche de la queue de “production” envisagée (i.e. même type de nœuds de calcul). P.ex. r815lin128ib
a été choisie pour la queue de production, il faut choisir r815_ib_test
pour les tests.
qsub programme <input >output
qsub -V -m b -m e -e /path/to/workdir/ -o /path/to/workdir/ -q $QUEUE script -V : verbose -m b : mail @begin -m e : mail @end -e : where to put error files -o : where to put output files -q : file d'attente
Il est plus simple de soumettre un script à SGE, qui contiendra plus d'options. Voir la documentation complète pour soumettre un job, ainsi que la liste des files d'attente.
qstat -u login
qstat -g c
qstat -u "*" -s r
qstat -u "*" -s p
qconf -sql
(sql : show queues list)
qstatqueue c6100lin24ib
qstatall
qstat -j 87584
qstat -j 87584 -g t
qstat -j 87584 -g t -s r
qdel 85903
qdel -f 109383
qacct -o login -d 30 | tail -1 | awk '{print $3/3600}'
ou
qacct -q "*" -o login -d 30 | awk '{ SUM += $5} END {print SUM/3600}'
qacct -b 201201010000 -e 201212312359 -o login | tail -1 | awk '{print $3/3600}'
Lancer la commande suivante :
qstat -g c
et regarder les deux dernières colonnes :