Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédenteProchaine révisionLes deux révisions suivantes | ||
documentation:tools:benchmarksgpu [2015/04/26 19:13] – [Tests de la bande passante] cicaluga | documentation:tools:benchmarksgpu [2016/09/29 10:01] – [Files d'attente GPU au PSMN] ltaulell | ||
---|---|---|---|
Ligne 3: | Ligne 3: | ||
{{INLINETOC}} | {{INLINETOC}} | ||
- | ===== Matériel disponible au PSMN ===== | + | ===== Files d' |
+ | |||
+ | Plusieurs files d' | ||
+ | |||
+ | <code bash> | ||
+ | qstat -g c | grep gpu | ||
+ | CLUSTER QUEUE | ||
+ | -------------------------------------------------------------------------------- | ||
+ | E5-2670gpuK20deb64 | ||
+ | E5-2670gpuM2070deb64 | ||
+ | E5-2670gpuM2090deb64 | ||
+ | r7x0deb128gpu | ||
+ | </ | ||
+ | |||
+ | ===== Frontales GPU ===== | ||
+ | |||
+ | Les machines dédiées à la compilation et aux tests des programmes GPU sont '' | ||
+ | |||
+ | ===== Matériel | ||
Plusieurs cartes GPU NVIDIA sont installées au PSMN : | Plusieurs cartes GPU NVIDIA sont installées au PSMN : | ||
+ | * [[http:// | ||
* [[http:// | * [[http:// | ||
* [[http:// | * [[http:// | ||
- | * [[http:// | + | * [[http:// |
- | Une comparaison des spécifications constructeur est donnée dans le tableau ci-dessous : | ||
+ | Comparaison des spécifications constructeur : | ||
- | ^ Spécifications techniques | + | ^ Spécifications techniques |
+ | | Version de CUDA | Cuda 5 | Cuda 5 | Cuda 6 | Cuda 6 | | ||
| |||| | | |||| | ||
- | | Performance peak en double précision | 1.17 Tflops | + | | Performance peak en double précision | |
| |||| | | |||| | ||
- | | Performance peak en simple précision | 3.52 Tflops | + | | Performance peak en simple précision |
| |||| | | |||| | ||
- | | Nombre de coeurs | 2496 | 2304 | | + | | Nombre de coeurs |
| |||| | | |||| | ||
- | | Fréquence coeurs | 0.706 GHz | 0.863 GHz | 1.3 GHz | | + | | Fréquence coeurs |
| |||| | | |||| | ||
- | | Mémoire | 5 GB | 3 GB | | + | | Mémoire |
| |||| | | |||| | ||
- | | Bande passante max (ECC off) | 208 GB/s | 288.4 GB/s | | + | | Bande passante max (ECC off) |
| |||| | | |||| | ||
- | | ECC (Error-correcting code memory)| | + | | ECC (Error-correcting code memory) |
| |||| | | |||| | ||
- | | Consommation max | 225 W | 250 W | + | | Consommation max | 250 W |
+ | |||
===== Logiciel disponible au PSMN ===== | ===== Logiciel disponible au PSMN ===== | ||
Le soft nécessaire au fonctionnement de ces cartes est installé avec les paquets Debian. Il s'agit de : | Le soft nécessaire au fonctionnement de ces cartes est installé avec les paquets Debian. Il s'agit de : | ||
* drivers | * drivers | ||
- | * librarie CUDA | + | * librarie CUDA (5 ou 6) |
* CUDA SDK (optionnel) | * CUDA SDK (optionnel) | ||
- | |||
- | ===== Files d' | ||
- | |||
- | Les files d' | ||
===== Benchmarks ===== | ===== Benchmarks ===== | ||
Ligne 180: | Ligne 198: | ||
==== Test de la bande passante ==== | ==== Test de la bande passante ==== | ||
+ | Un autre test fourni avec NVIDIA_GPU_Computing_SDK est le programme bandwidthTest. Après la compilation du programme source .cpp, son exécution donne la largeur de la bande pour trois transferts qui doivent être pris en compte dans le développement de codes CUDA : | ||
+ | * transfert depuis CPU sur le GPU | ||
+ | * transfert depuis GPU sur le CPU | ||
+ | * transfert depuis GPU sur le GPU (intra GPU) | ||
+ | Ci-dessous la sortie complète de ce programme sur le même noeud que précédemment : | ||
+ | |||
+ | <code bash> | ||
+ | c82gpgpu34: | ||
+ | c82gpgpu34: | ||
+ | |||
+ | ./ | ||
+ | |||
+ | Running on... | ||
+ | |||
+ | | ||
+ | Quick Mode | ||
+ | |||
+ | Host to Device Bandwidth, 1 Device(s), Paged memory | ||
+ | | ||
+ | | ||
+ | |||
+ | | ||
+ | | ||
+ | | ||
+ | |||
+ | | ||
+ | | ||
+ | | ||
+ | |||
+ | </ | ||
- | ==== Tests de performance des bibliothèques d' | ||
==== Tests de performance de la composante FFT de Cuda ==== | ==== Tests de performance de la composante FFT de Cuda ==== | ||
+ | |||
+ | |||
+ | ==== Tests de performance des bibliothèques d' | ||
==== Tests de performance des codes " | ==== Tests de performance des codes " | ||
des codes " | des codes " |