La RTX 5090 en calcul scientifique : Au-delà du Gaming
Blackwell : Une rupture pour le calcul FP64 ?
Nvidia a lancé la série RTX 5000 début 2025. Si les gamers regardent les FPS, en tant qu'ingénieur HPC, je regarde les TFLOPS en double précision (FP64) et la bande passante mémoire.
Architecture Mémoire GDDR7
La grande nouveauté est l'arrivée de la GDDR7. Avec une bande passante dépassant les 1.5 TB/s, on s'approche des performances des cartes pro (H100) pour une fraction du prix. Pour mes simulations de fluides (CFD), c'est le goulot d'étranglement principal qui saute.
CUDA 13 et optimisation
J'ai porté mon code de simulation N-Body sur cette architecture. Résultats :
- Vitesse de transfert Host-to-Device : +40% grâce au PCIe 5.0 pleinement exploité.
- Kernel Execution : Les nouveaux Tensor Cores gèrent nativement certaines opérations de matrices creuses (Sparse Matrices) utiles en éléments finis.
L'avis de l'ingénieur
Pour un étudiant ou un chercheur indépendant, la 5090 devient la station de travail ultime. Attention cependant à la consommation : 600W en crête, il faut revoir le refroidissement du boîtier si vous comptez faire tourner des jobs MPI de 48h.