Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédenteProchaine révisionLes deux révisions suivantes | ||
documentation:tools:benchmarksgpu [2015/04/26 18:58] – [Tests de la bande passante] cicaluga | documentation:tools:benchmarksgpu [2016/09/29 10:05] – ltaulell | ||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
- | ====== Utilisation des GPUs au PSMN ====== | + | ===== Benchmarks |
- | + | ||
- | {{INLINETOC}} | + | |
- | + | ||
- | ===== Matériel disponible au PSMN ===== | + | |
- | + | ||
- | Plusieurs cartes GPU NVIDIA sont installées au PSMN : | + | |
- | * [[http:// | + | |
- | * [[http:// | + | |
- | * [[http:// | + | |
- | + | ||
- | Une comparaison des spécifications constructeur est donnée dans le tableau ci-dessous : | + | |
- | + | ||
- | + | ||
- | ^ Spécifications techniques | + | |
- | | |||| | + | |
- | | Performance peak en double précision | 1.17 Tflops | + | |
- | | |||| | + | |
- | | Performance peak en simple précision | 3.52 Tflops | + | |
- | | |||| | + | |
- | | Nombre de coeurs | 2496 | 2304 | 512 | | + | |
- | | |||| | + | |
- | | Fréquence coeurs | 0.706 GHz | 0.863 GHz | 1.3 GHz | | + | |
- | | |||| | + | |
- | | Mémoire | 5 GB | 3 GB | 6 GB | | + | |
- | | |||| | + | |
- | | Bande passante max (ECC off) | 208 GB/s | 288.4 GB/s | 177.6 GB/s | | + | |
- | | |||| | + | |
- | | ECC (Error-correcting code memory)| | + | |
- | | |||| | + | |
- | | Consommation max | 225 W | 250 W | + | |
- | ===== Logiciel disponible au PSMN ===== | + | |
- | + | ||
- | Le soft nécessaire au fonctionnement de ces cartes est installé avec les paquets Debian. Il s'agit de : | + | |
- | * drivers | + | |
- | * librarie CUDA | + | |
- | * CUDA SDK (optionnel) | + | |
- | + | ||
- | + | ||
- | ===== Files d' | + | |
- | + | ||
- | Les files d' | + | |
- | + | ||
- | ===== Benchmarks ===== | + | |
Plusieurs tests de fonctionnement et de performance de ces cartes sont présentés : | Plusieurs tests de fonctionnement et de performance de ces cartes sont présentés : | ||
Ligne 92: | Ligne 49: | ||
- | Uns autre possibilité (hors commandes Linux) pour détecter la présence et le type de GPUS NVIDIA est de faire appel au programme deviceQuery dont le source .cpp est contenu dans la suite NVIDIA_GPU_Computing_SDK (devenue NVIDIA_CUDA-x.y_Samples dans les versions x.y récentes). Après compilation, | + | **Uns autre possibilité** (hors commandes Linux) pour détecter la présence et le type de GPUS NVIDIA est de faire appel au programme deviceQuery dont le source .cpp est contenu dans la suite NVIDIA_GPU_Computing_SDK (devenue NVIDIA_CUDA-x.y_Samples dans les versions x.y récentes). Après compilation, |
<code bash> | <code bash> | ||
Ligne 178: | Ligne 135: | ||
</ | </ | ||
- | ==== Tests de la bande passante ==== | + | ==== Test de la bande passante ==== |
+ | |||
+ | Un autre test fourni avec NVIDIA_GPU_Computing_SDK est le programme bandwidthTest. Après la compilation du programme source .cpp, son exécution donne la largeur de la bande pour trois transferts qui doivent être pris en compte dans le développement de codes CUDA : | ||
+ | * transfert depuis CPU sur le GPU | ||
+ | * transfert depuis GPU sur le CPU | ||
+ | * transfert depuis GPU sur le GPU (intra GPU) | ||
+ | Ci-dessous la sortie complète de ce programme sur le même noeud que précédemment : | ||
+ | |||
+ | <code bash> | ||
+ | c82gpgpu34: | ||
+ | c82gpgpu34: | ||
+ | |||
+ | ./ | ||
+ | |||
+ | Running on... | ||
+ | |||
+ | | ||
+ | Quick Mode | ||
+ | |||
+ | Host to Device Bandwidth, 1 Device(s), Paged memory | ||
+ | | ||
+ | | ||
+ | |||
+ | | ||
+ | | ||
+ | | ||
+ | |||
+ | | ||
+ | | ||
+ | | ||
+ | |||
+ | </ | ||
- | ==== Tests de performance des bibliothèques d' | ||
==== Tests de performance de la composante FFT de Cuda ==== | ==== Tests de performance de la composante FFT de Cuda ==== | ||
+ | |||
+ | |||
+ | ==== Tests de performance des bibliothèques d' | ||
==== Tests de performance des codes " | ==== Tests de performance des codes " | ||
des codes " | des codes " |