Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédenteDernière révisionLes deux révisions suivantes | ||
documentation:tools:benchmarksgpu [2015/04/26 19:22] – [Test de la bande passante] cicaluga | documentation:tools:benchmarksgpu [2020/08/25 15:58] – modification externe 127.0.0.1 | ||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
- | ====== Utilisation des GPUs au PSMN ====== | + | ===== Benchmarks |
- | + | ||
- | {{INLINETOC}} | + | |
- | + | ||
- | ===== Matériel disponible au PSMN ===== | + | |
- | + | ||
- | Plusieurs cartes GPU NVIDIA sont installées au PSMN : | + | |
- | * [[http:// | + | |
- | * [[http:// | + | |
- | * [[http:// | + | |
- | + | ||
- | Une comparaison des spécifications constructeur est donnée dans le tableau ci-dessous : | + | |
- | + | ||
- | + | ||
- | ^ Spécifications techniques | + | |
- | | |||| | + | |
- | | Performance peak en double précision | 1.17 Tflops | + | |
- | | |||| | + | |
- | | Performance peak en simple précision | 3.52 Tflops | + | |
- | | |||| | + | |
- | | Nombre de coeurs | 2496 | 2304 | 512 | | + | |
- | | |||| | + | |
- | | Fréquence coeurs | 0.706 GHz | 0.863 GHz | 1.3 GHz | | + | |
- | | |||| | + | |
- | | Mémoire | 5 GB | 3 GB | 6 GB | | + | |
- | | |||| | + | |
- | | Bande passante max (ECC off) | 208 GB/s | 288.4 GB/s | 177.6 GB/s | | + | |
- | | |||| | + | |
- | | ECC (Error-correcting code memory)| | + | |
- | | |||| | + | |
- | | Consommation max | 225 W | 250 W | + | |
- | ===== Logiciel disponible au PSMN ===== | + | |
- | + | ||
- | Le soft nécessaire au fonctionnement de ces cartes est installé avec les paquets Debian. Il s'agit de : | + | |
- | * drivers | + | |
- | * librarie CUDA | + | |
- | * CUDA SDK (optionnel) | + | |
- | + | ||
- | + | ||
- | ===== Files d' | + | |
- | + | ||
- | Les files d' | + | |
- | + | ||
- | ===== Benchmarks ===== | + | |
Plusieurs tests de fonctionnement et de performance de ces cartes sont présentés : | Plusieurs tests de fonctionnement et de performance de ces cartes sont présentés : | ||
Ligne 186: | Ligne 143: | ||
Ci-dessous la sortie complète de ce programme sur le même noeud que précédemment : | Ci-dessous la sortie complète de ce programme sur le même noeud que précédemment : | ||
+ | <code bash> | ||
+ | c82gpgpu34: | ||
+ | c82gpgpu34: | ||
+ | |||
+ | ./ | ||
+ | |||
+ | Running on... | ||
+ | |||
+ | | ||
+ | Quick Mode | ||
+ | |||
+ | Host to Device Bandwidth, 1 Device(s), Paged memory | ||
+ | | ||
+ | | ||
+ | |||
+ | | ||
+ | | ||
+ | | ||
+ | |||
+ | | ||
+ | | ||
+ | | ||
+ | |||
+ | </ | ||
- | ==== Tests de performance des bibliothèques d' | ||
==== Tests de performance de la composante FFT de Cuda ==== | ==== Tests de performance de la composante FFT de Cuda ==== | ||
+ | |||
+ | |||
+ | ==== Tests de performance des bibliothèques d' | ||
==== Tests de performance des codes " | ==== Tests de performance des codes " | ||
des codes " | des codes " |