Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentesRévision précédente
Prochaine révision
Révision précédente
documentation:tools:benchmarksgpu [2015/04/26 08:41] – [Matériel disponible au PSMN] cicalugadocumentation:tools:benchmarksgpu [2023/01/12 09:39] (Version actuelle) – supprimée ltaulell
Ligne 1: Ligne 1:
-====== Utilisation des GPUs au PSMN ====== 
  
-{{INLINETOC}} 
- 
-===== Matériel disponible au PSMN ===== 
- 
-Plusieurs cartes GPU NVIDIA sont installées au PSMN : 
-  * [[http://www.nvidia.fr/content/PDF/kepler/Tesla-K20-Passive-BD-06455-001-v07.pdf |Tesla K20]] 
-  * [[http://www.nvidia.fr/object/geforce-gtx-780-fr.html#pdpContent=2 |GeForce GTX780]] 
-  * [[http://www.nvidia.com/docs/IO/43395/tesla-m2090-board-specifications.pdf |Tesla M2090]]  
- 
-Une comparaison des spécifications constructeur est donnée dans le tableau ci-dessous : 
- 
- 
-^  Spécifications techniques  ^  Tesla  K20  ^  GeForce GTX780  ^  Tesla M2090  ^   
-|    |||| 
-|  Performance peak en double précision |  1.17 Tflops  |  0.166 Tflops  |  0.66 Tflops  
-|    |||| 
-|  Performance peak en simple précision |  3.52 Tflops  |  3.97 Tflops  |  1.33 Tflops  
-|    |||| 
-|  Nombre de coeurs |  2496  |  2304  |  512  |  
-|    |||| 
-|  Fréquence coeurs |  0.706 GHz  |  0.863 GHz  |  1.3 GHz  |  
-|    |||| 
-|  Mémoire |  5 GB  |  3 GB  |  6 GB  |  
-|    |||| 
-|  Bande passante max (ECC off)  |  208 GB/s  |  288.4 GB/s  |  177.6 GB/s  | 
-|    |||| 
-|  ECC (Error-correcting code memory)|  oui  |  non  |  oui  |  
-|    |||| 
-|  Consommation max |  225 W  |  250 W    250 W  |  
-===== Logiciel disponible au PSMN =====  
- 
-Le soft nécessaire au fonctionnement de ces cartes est installé avec les paquets Debian. Il s'agit de : 
-  * drivers 
-  * librarie CUDA 
-  * CUDA SDK (optionnel) 
- 
- 
-===== Files d'attente =====  
- 
-Les files d'attente pour l'utilisation des GPUs sont décrites sur la page : [[documentation:clusters:batch|Les files d'attente]] 
- 
-===== Benchmarks ===== 
- 
-Plusieurs tests de fonctionnement et de performance de ces cartes sont présentés :  
- 
-==== Tests de détection matériel et logiciel ==== 
- 
-Avec la commande linux lspci (qui affiche la liste de périphériques PCI, dont les cartes GPU) : 
- 
-<code bash>  
-c82gpgpu34:~> lspci -v | grep -i nvidia 
-05:00.0 3D controller: NVIDIA Corporation GK110GL [Tesla K20m] (rev a1) 
- Subsystem: NVIDIA Corporation Device 1015 
- Kernel driver in use: nvidia 
-83:00.0 3D controller: NVIDIA Corporation GK110GL [Tesla K20m] (rev a1) 
- Subsystem: NVIDIA Corporation Device 1015 
- Kernel driver in use: nvidia 
-</code> 
- 
-Cette commande ne retourne rien si lancée sur les serveurs de compilations (p.ex. e5-2670comp1) puisqu'il n'y a pas de carte GPU installée.  
- 
-La sortie précédente est obtenue sur un noeud de calcul qui dispose de cartes GPU (dans cet exemple il s'agit du noeud c82gpgpu34 qui dispose de 2 cartes Tesla K20). 
- 
-La commande linux lsmod affiche l'état et la liste de modules chargés du noyau Linux : 
- 
-<code bash>  
-c82gpgpu34:~> lsmod | grep nvidia 
-nvidia_uvm             33340  
-nvidia              10492298  1 nvidia_uvm 
-i2c_core               23876  4 i2c_algo_bit,igb,i2c_i801,nvidia 
-</code> 
- 
-Pour afficher la version du driver CUDA installé : 
-<code bash>  
-c82gpgpu34:~> cat /proc/driver/nvidia/version 
-NVRM version: NVIDIA UNIX x86_64 Kernel Module  340.65  Tue Dec  2 09:50:34 PST 2014 
-GCC version:  gcc version 4.6.3 (Debian 4.6.3-14)  
-</code> 
- 
-Pour afficher la version du CUDA Toolkit installé : 
-<code bash>  
-c82gpgpu34:~> nvcc -V  
-nvcc: NVIDIA (R) Cuda compiler driver 
-Copyright (c) 2005-2013 NVIDIA Corporation 
-Built on Wed_Jul_17_18:36:13_PDT_2013 
-Cuda compilation tools, release 5.5, V5.5.0 
-</code> 
- 
-nvcc est le compilateur fourni dans le driver pour compiler des programmes CUDA (il appelle le compilateur gcc pour compiler le code C)  
- 
-==== Tests de la bande passante ==== 
-==== Tests de performance des bibliothèques d'algèbre linéaire ==== 
-==== Tests de performance de la composante FFT de Cuda ==== 
-==== Tests de performance des codes "maison" portés sur GPUs ==== 
- des codes "maison" portés sur GPUs ([[http://www.cbp.ens-lyon.fr/doku.php?id=developpement:productions:logiciels:anisotropicblur|Anisotropic Blur]] )