Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentesRévision précédente
Prochaine révision
Révision précédente
Dernière révisionLes deux révisions suivantes
en:documentation:tools:sge [2018/09/04 11:45] – [Accounting] cpetiten:documentation:tools:sge [2020/08/25 15:58] – modification externe 127.0.0.1
Ligne 1: Ligne 1:
 ====== GridEngine ====== ====== GridEngine ======
  
-<WRAP center round todo 60%> 
-Under contruction... 
-</WRAP> 
  
 The job scheduler (or batch-queuing system) used in PSMN cluster is SGE,-previously Sun Grid Engine and now Son of Grid Engine-; it manages the execution of non-interactive jobs. The job scheduler (or batch-queuing system) used in PSMN cluster is SGE,-previously Sun Grid Engine and now Son of Grid Engine-; it manages the execution of non-interactive jobs.
Ligne 37: Ligne 34:
 ===== GridEngine : Submitting jobs ===== ===== GridEngine : Submitting jobs =====
  
-The normal way to submit jobs to the cluster is using the ''qsub'' command. For example: +<code> 
- +qsub programme <input >output
-<code bash+
-qsub myscript.sh+
 </code> </code>
  
-The many options to the ''qsub'' command are described in the manpage, ''man qsub'' 
- 
-For example a more complex submission: 
 <code bash> <code bash>
-qsub -V -m b -m e -e /path/to/workdir/ -o /path/to/workdir/ -q $QUEUE script+qsub -V -e /path/to/workdir/ -o /path/to/workdir/ -q $QUEUE script
  
 -V : export environment variables -V : export environment variables
--m b : mail @begin 
--m e : mail @end 
 -e : where to put error files -e : where to put error files
 -o : where to put output files -o : where to put output files
Ligne 57: Ligne 47:
 </code> </code>
  
-** Nevertheless, it is easier to directly submit to GridEngine a script containing the desired options**. You can follow the documentation on [[documentation:tutorials:submit|how to submit a job (full documentation)]]. Moreover take a look at [[documentation:clusters:batch&#les_files_d_attente|the list of available queues for submission]].+**It is simpler to submit a script to GridEngine, which will contain more options**. 
  
-==== Comment choisir les files d'attentede test ou de productions, adaptées ? ====+<note important>Some options don't work directly in CLIyou have to use a script (example: send mails beginning and end).</note>
  
-De par les achats successifs de nœuds de calcul avec des architectures de génération différenteil n'était pas possible de définir une seule file d'attente. Il est préférable d'avoir des files d'attentes différentes pour chaque architecture, afin d'atteindre des performances intéressantes pour chaque file d'attente.+Voir [[documentation:tutorials:submit:accueil|complete documentation to submit a job]]as well as [[documentation:clusters:batch&#les_files_d_attente|the queue list]].
  
-Concrètement le choix de la file d'attente de "production" devrait se faire en fonction de l'objectif voulu :+==== How to choose the adapted queues for my needs? ====
  
-  * si le critère principal est la rapidité de l'exécutionil faut regarder quelles sont les files d'attentes disponibles pour recevoir le jobL'utilisation des commandes du type ''qstat -g c'' devraient être la base de ce choix.  +Due to successive purchases of compute nodes with cores/CPU architectures of different generationit was not possible to define a single queueIt is better to have different queues for each architecturein order to achieve interesting performance for each queue.
-  * si le critère principal est le grand nombre de ressources (p.ex. un job avec beaucoup de cœurs, un job avec beaucoup de mémoire RAM), alors il faut plutôt s'orienter vers les files d'attentes qui possèdent un grand nombre de ressources (au moins les ressources demandées par le job)même si le temps d'attente dans la file d'attente est plus important+
  
-Évidemment, la commande ci-dessus et [[documentation:clusters:batch&#les_files_d_attente|la liste des files d'attente]] devraient guider votre choix. 
  
-Et bien surpour la mise au point du codeil faut choisir une file d'attente de test qui soit la plus proche de la file d'attente de "production" envisagée (i.e. même type de nœuds de calcul). P.ex. ''r815lin128ib'' a été choisie pour la file d'attente de production, il faut choisir ''r815_ib_test'' pour les tests+In concrete termsthe choice of the "production" queue should be made according to the desired objective: 
-===== GridEngine : Les autres commandes utiles =====+ 
 +  * if the main criterion is the speed of executionyou must look at what are the queues available to accept the job. The use of commands of the type ''qstat -g c'' should help you to chose the intended queue 
 +  * if the main criterion is the large number of resources (//eg// a job with a lot of cores, a job with a lot of RAM,etc), then you have to move towards the queues that have a large number of resources (at least the resources requested by the job), even if waiting time in the queue is greater. 
 + 
 +Obviously, the above command (''qstat -g c'') and [[documentation:clusters:batch&#les_files_d_attente|the list of queues]] should guide your choice. 
 + 
 +And, of course, when tuning ypur code, you have to choose a test queue that is closest to the intended "production" queue (//i.e.// same type of compute nodes). //Eg// ''r815lin128ib'' was chosen for the production queueyou thus have to run your tests on ''r815_ib_test''
 +===== GridEngine : other useful commands =====
  
 ==== Checking job status ==== ==== Checking job status ====
Ligne 82: Ligne 77:
  
 <code>qstat -g c </code> <code>qstat -g c </code>
 +
 +  * display nodes status in a given queue: 
 +
 +<code>qstat -q <queue_name> -f </code>
  
     * display the running jobs of all users:      * display the running jobs of all users: