Différences

Ci-dessous, les différences entre deux révisions de la page.

--- documentation:tools:benchmarksgpu [2015/04/26 19:13] – [Tests de la bande passante] cicaluga
+++ documentation:tools:benchmarksgpu [2016/09/29 10:01] – [Files d'attente GPU au PSMN] ltaulell
@@ Ligne 3: / Ligne 3: @@
 {{INLINETOC}}
-===== Matériel disponible au PSMN =====
+===== Files d'attente GPU au PSMN =====
+Plusieurs files d'attente consistant en noeuds avec GPUs sont configurées au PSMN. Pour connaître ces files d'attente GPU vous pouvez soit consulter la page décrivant [[documentation:clusters:batch&#les_files_d_attente|les files d'attente (queues)]] (rubrique "Les files d'attente GPGPU") soit lancer cette commande sur un serveur de soumission (p.ex. les serveurs de compilation) :
+<code bash>
+qstat -g c | grep gpu
+CLUSTER QUEUE                   CQLOAD   USED    RES  AVAIL  TOTAL aoACDS  cdsuE
+--------------------------------------------------------------------------------
+E5-2670gpuK20deb64                0.02      2      0     62     64      0      0
+E5-2670gpuM2070deb64              0.03     64      0      0     64      0      0
+E5-2670gpuM2090deb64              0.03      0      0      0     16      0     16
+r7x0deb128gpu                     0.11     16      0      0     20      0      4
+</code>
+===== Frontales GPU =====
+Les machines dédiées à la compilation et aux tests des programmes GPU sont ''c82gpgpu35'' (M2090, Cuda5) et ''r730visu'' (Q4000, Cuda6).
+===== Matériel GPU disponible au PSMN =====
 Plusieurs cartes GPU NVIDIA sont installées au PSMN :
+  * [[http://www.nvidia.com/docs/IO/43395/tesla-m2090-board-specifications.pdf |Tesla M2090]]
   * [[http://www.nvidia.fr/content/PDF/kepler/Tesla-K20-Passive-BD-06455-001-v07.pdf |Tesla K20]]
   * [[http://www.nvidia.fr/object/geforce-gtx-780-fr.html#pdpContent=2 |GeForce GTX780]]
-  * [[http://www.nvidia.com/docs/IO/43395/tesla-m2090-board-specifications.pdf |Tesla M2090]]
+  * [[http://www.nvidia.fr/object/geforce-gtx-980-fr.html#pdpContent=2 |GeForce GTX980]]
-Une comparaison des spécifications constructeur est donnée dans le tableau ci-dessous :
+Comparaison des spécifications constructeur :
-^  Spécifications techniques  ^  Tesla  K20  ^  GeForce GTX780  ^  Tesla M2090  ^
+^  Spécifications techniques  ^  Tesla M2090  ^  Tesla  K20  ^  GeForce GTX780 ^  GeForce GTX980  ^
+|  Version de CUDA  |  Cuda 5  |  Cuda 5  |  Cuda 6  |  Cuda 6  |
 |    ||||
-|  Performance peak en double précision |  1.17 Tflops  |  0.166 Tflops  |  0.66 Tflops  |
+|  Performance peak en double précision |  0.66 Tflops  |  **1.17 Tflops**  |  0.166 Tflops  |  0.144 Tflops  |
 |    ||||
-|  Performance peak en simple précision |  3.52 Tflops  |  3.97 Tflops  |  1.33 Tflops  |
+|  Performance peak en simple précision |  1.33 Tflops  |  3.52 Tflops  |  3.97 Tflops  |  **4.6 Tflops**  |
 |    ||||
-|  Nombre de coeurs |  2496  |  2304  |  512  |
+|  Nombre de coeurs |  512  |  2496  |  2304  |  2048  |
 |    ||||
-|  Fréquence coeurs |  0.706 GHz  |  0.863 GHz  |  1.3 GHz  |
+|  Fréquence coeurs |  1.3 GHz  |  0.706 GHz |  0.863 GHz  |  1.126 GHz  |
 |    ||||
-|  Mémoire |  5 GB  |  3 GB  |  6 GB  |
+|  Mémoire |  6 GB  |  5 GB  |  3 GB  |  4 GB  |
 |    ||||
-|  Bande passante max (ECC off)  |  208 GB/s  |  288.4 GB/s  |  177.6 GB/s  |
+|  Bande passante max (ECC off)  |  177.6 GB/s  |  208 GB/s  |  288.4 GB/s  |  224 GB/s  |
 |    ||||
-|  ECC (Error-correcting code memory)|  oui  |  non  |  oui  |
+|  ECC (Error-correcting code memory)  |  oui  |   oui  |  non  |  non  |
 |    ||||
-|  Consommation max |  225 W  |  250 W   |  250 W  |
+|  Consommation max |  250 W  |  225 W  |  250 W  |  165 W  |
 ===== Logiciel disponible au PSMN =====
 Le soft nécessaire au fonctionnement de ces cartes est installé avec les paquets Debian. Il s'agit de :
   * drivers
-  * librarie CUDA
+  * librarie CUDA (5 ou 6)
   * CUDA SDK (optionnel)
-===== Files d'attente =====
-Les files d'attente pour l'utilisation des GPUs sont décrites sur la page : [[documentation:clusters:batch|Les files d'attente]]
 ===== Benchmarks =====
@@ Ligne 180: / Ligne 198: @@
 ==== Test de la bande passante ====
+Un autre test fourni avec NVIDIA_GPU_Computing_SDK est le programme bandwidthTest. Après la compilation du programme source .cpp, son exécution donne la largeur de la bande pour trois transferts qui doivent être pris en compte dans le développement de codes CUDA :
+  * transfert depuis CPU sur le GPU
+  * transfert depuis GPU sur le CPU
+  * transfert depuis GPU sur le GPU (intra GPU)
+Ci-dessous la sortie complète de ce programme sur le même noeud que précédemment :
+<code bash>
+c82gpgpu34:~> cd NVIDIA_GPU_Computing_SDK
+c82gpgpu34:~> .C//bin/linux/release/bandwidthTest
+./C/bin/linux/release/bandwidthTest Starting...
+Running on...
+ Device 0: Tesla K20m
+ Quick Mode
+ Host to Device Bandwidth, 1 Device(s), Paged memory
+   Transfer Size (Bytes)	Bandwidth(MB/s)
+   33554432			3819.7
+ Device to Host Bandwidth, 1 Device(s), Paged memory
+   Transfer Size (Bytes)	Bandwidth(MB/s)
+   33554432			3381.9
+ Device to Device Bandwidth, 1 Device(s)
+   Transfer Size (Bytes)	Bandwidth(MB/s)
+   33554432			143586.3
+</code>
-==== Tests de performance des bibliothèques d'algèbre linéaire ====
 ==== Tests de performance de la composante FFT de Cuda ====
+==== Tests de performance des bibliothèques d'algèbre linéaire ====
 ==== Tests de performance des codes "maison" portés sur GPUs ====
  des codes "maison" portés sur GPUs ([[http://www.cbp.ens-lyon.fr/doku.php?id=developpement:productions:logiciels:anisotropicblur|Anisotropic Blur]] )

Rechercher

Translations

Piste :

Vous êtes ici : accueil » documentation » tools » benchmarksgpu

Navigation

accueil
ateliers
contact
documentation
- clusters
- formations
- tools
- tutorials
en
faq
mesocentre
news
newsfeed
science
tag
wiki
menu
navigation