Test : MSI RTX 3080 SUPRIM X, le nouveau haut de gamme par MSI

Par

21 novembre 2020

Architecture Ampere

L’architecture Ampere représente la deuxième génération de cartes graphiques RTX. Celle-ci améliore de l’ordre de 1,9 fois les performances par Watts comparativement à l’architecture précédente Turing. Nous avons un GPU GA102-200 de chez Samsung avec une finesse de gravure de 8 nm et qui intègre 28 milliards de transistors. Nous avons un TGP de 370 W pour la SUPRIM X (340 W pour la GAMING X TRIO) et l’alimentation se fait en 3×8-pins. Mais avant de partir dans les détails, refaisons le point également sur les caractéristiques des RTX 3000 Series face à la RTX 2080 Ti.

	RTX 3090	RTX 3080	RTX 3070	RTX 2080 Ti
GPU	8nm GA102-300	8nm GA102-200	8nm GA104-300	12nm TU102-300
Die Size	628 mm2	628 mm2	392 mm2	754 mm2
Transistors	28,3 B	28 B	17.4 B	18.6 B
Board	PG132 SKU 30	PG132 SKU 10	PG142 SKU 10	PG150 SKU 32
CUDA Cores	10 496	8 704	5 888	4 352
Tensor Cores	328 (4 par SM)	272 (4 par SM)	184 (4 par SM)	544 (8 par SM)
RT Cores	82	68	46	68
Base Clock	1395 MHz	1440 MHz	1500 MHz	1350 MHz
Boost Clock	1695 MHz référence	1710 MHz 1905 MHz MSI	1725 MHz	1545 MHz
Shader Perf.	35.6 TFLOPS	29.8 TFLOPS	20.3 TFLOPS	13.4 TFLOPS
RT Perf.	285 TFLOPS	283 TFLOPS	163 TFLOPS	110 TFLOPS
Memory	24 Go GDDR6X	10 Go GDDR6X	8 Go GDDR6	11 Go GDDR6
Memory Clock	19.5 Gbps	19 Gbps	14 Gbps	14 Gbps
Memory Bus	384-bit	320-bit	256-bit	352-bit
Bandwidth	936 GB/s	760 GB/s	441 GB/s	616 GB/s
TDP	350W référence	320W 370W MSI	220W	250W
MSRP	1549 euros référence	719 euros	519 euros	1259 euros

Processeur de Streaming

L’un des aspects les plus importants de l’architecture Ampere repose sur les processeurs de streaming, alias les SM (streaming multiprocessors). Comparativement à la génération précédente, les nouveaux SM offrent le double des performances en FP32. D’ailleurs, sur cette RTX 3080 on trouve 68 SM contenant chacun 4 Tensor Cores. On obtient donc les 272 Tensor Cores. Sur le schéma ci-dessous on peut voir de quoi est constitué un SM avec les 4 Tensor Cores, mais également que chaque unité dispose de 32 cœurs FP32 ((32*4)*68) = les 8 704 cœurs CUDA. Notez que parmi les 32 cœurs présents dans chacune des quatre unités que compose un SM, 16 d’entre eux peuvent effectuer simultanément des calculs INT32 et FP32.

RT Cores et Tensor Cores

On remarquera que le nombre de RT Cores est identique à la RTX 2080 Ti, mais il faut prendre en compte que l’IPC a augmenté de 1,7x. La technologie Ray Tracing utilise tout particulièrement ces cœurs. Pour rappel, cette technologie qu’on appelle aussi souvent « RTX » consiste à traiter la lumière en temps réel dans les jeux pour apporter davantage de réalisme dans les ombres, reflets, etc. Cela à un niveau impossible à atteindre manuellement, ou alors contre beaucoup trop de temps. Le contrecoup de cette technologie est sa très forte consommation en ressources graphiques et la chute inévitable des FPS. Pour pallier à cela, les Tensor Cores entrent en jeu avec la technologie DLSS (Deep Learning Super Sampling) qui repose sur un réseau neuronal d’apprentissage et augmente les FPS. Cette technologie fonctionne via l’algorithme d’Intelligence Artificielle qui conserve, voire même améliore, la qualité d’image dans certains cas. Ces Tensor Cores sont issus de la troisième génération et bénéficient d’un IPC 2,7 fois plus important comparativement à l’architecture précédente. C’est aussi cette technologie qui permet, entre autres, de jouer jusqu’en 8K avec une RTX 3090 via un mode Ultra Performance.

RTX IO

RTX IO est une nouvelle architecture de stockage. Concrètement, jusqu’à présent la carte graphique communiquait avec le stockage via le processeur et la mémoire système. Cette charge étant de plus en plus forte sur le processeur; il peut y avoir un impact visible sur les performances. NVIDIA arrange la situation en faisant communiquer la carte graphique directement avec le stockage, sans intermédiaire, ce qui permet d’accélérer les débits. RTX IO apporte une décompression de données sans perte accélérée par GPU, ce qui signifie que les données restent compressées et regroupées avec moins d’en-têtes d’E/S, car elles sont déplacées du disque vers le GPU. NVIDIA annonce que cela permet de saturer la bande passante du PCIe 4.0 en atteignant le cap de 14 Go/s. À titre de comparaison, le système présenté sur la console de salon PlayStation 5 qui a fait beaucoup de bruit est à 9 Go/s.

À noter que cette technologie est annoncée comme compatible avec les cartes graphiques basées sur Turing également (RTX 2000 Series). Cela se fera via de prochaines mises à jour. Il faut aussi prendre en compte qu’un SSD PCIe 4.0 n’est pas obligatoire pour profiter de RTX IO. En effet, cela fonctionnera même avec un SSD NVMe en PCIe 3.0, il faut simplement se dire que plus le SSD sera rapide, plus les débits seront élevés et les temps de chargement courts dans les jeux.

Selon les tests de NVIDIA, la lecture de données non compressées à partir d’un SSD à 7 Go/s comme le Samsung 980 Pro, nécessite l’utilisation complète de deux cœurs de processeur. Puis le système d’exploitation répartit cette charge de travail entre les cœurs et threads disponibles. Le problème est que pour un jeu triple A récent, des centaines de milliers de ressources individuelles sont entassées dans des fichiers compressés.

Bien qu’au niveau d’E/S du disque, les uns et les zéros soient toujours déplacés jusqu’à 7 Go/s, le flux de données décompressé au niveau du processeur peut atteindre 14 Go/s dans le meilleur des cas. Ajoutez à cela le fait que chaque demande d’E/S arrive avec sa propre surcharge : un ensemble d’instructions permettant au CPU de récupérer « x » éléments de ressource du fichier « y » et le livrer au tampon « z », le tout avec des instructions pour décompresser ou décrypter la ressource. Cela pourrait prendre énormément de puissance au processeur à une échelle de débit IO élevée, et NVIDIA fixe le nombre de cœurs de processeur requis à 24. C’est l’API DirectStorage qui permet aux périphériques de traiter directement la pile de stockage pour accéder aux ressources dont ils ont besoin. Notez aussi que l‘API de Microsoft a été initialement développée pour la Xbox Series X, mais elle fait maintenant ses débuts sur la plate-forme PC. Cela veut dire en revanche que les jeux doivent être optimisés pour cet API. Si on prend en compte le fait que cette technologie est déjà utilisée sur Xbox, alors les jeux console déjà portés sur PC disposent eux aussi de quelques optimisations pour l’API. Ils devront cependant recevoir quelques modifications pour être pleinement supportés sur PC.

Pour les cartes graphiques, on s’attend à ce que seules les RTX le supportent, y compris la génération précédente reposant sur Turing.

NVIDIA Reflex et Latency Analyzer

Durant l’annonce de cette génération de GPU, NVIDIA a également présenté la technologie Reflex. Celle-ci permet de réduire la latence des jeux (esports notamment) jusqu’à 50 %. Les premiers jeux prenant en charge NVIDIA Reflex sont : Valorant, Apex Legends, Call of Duty Warzone, Destiny 2 et bien sûr Fortnite. Les développeurs disposent d’APIs fournies par NVIDIA pour l’intégrer à leurs jeux. Du côté des utilisateurs cette technologie arrivera sous la forme d’une mise à jour du pilote GeForce. Notez que cela fonctionne non seulement avec les nouvelles RTX 3000 Series, mais également à partir des GTX 900, un aspect important à souligner. Pour rappel, la latence représente le laps de temps entre l’action, par exemple un clic sur la souris et le moment où l’action est affichée à l’écran.

Niveau fonctionnement, le pilote travaille de concert avec le moteur du jeu pour optimiser les débits du rendu 3D. La file d’attente de rendu est réduite dynamiquement et moins d’images sont laissées en file d’attente. NVIDIA déclare que cette technologie permet de garder le GPU parfaitement synchronisé avec le CPU (file d’attente de rendu 1: 1).

Sur le graphique ci-dessous, NVIDIA montre l’efficacité de sa technologie Reflex. Notez que sur la configuration de test, il s’agit seulement d’une GTX 1660 SUPER avec un processeur Intel Core i9, le tout avec une définition 1080p. Dans les quatre jeux présentés, tous en profitent à plus ou moins grande échelle.

Avec NVIDIA Reflex, la marque a présenté un nouveau standard pour les moniteurs esports : les écrans G-Sync 360 Hz avec la technologie NVIDIA Reflex Latency Analyzer. Cette dernière est intégrée via le module G-Sync de l’écran et permet de mesurer la latence d’un écran, d’une souris et du PC dans un jeu. Accompagnés d’un taux de rafraîchissement à 360 Hz qui réduit déjà naturellement l’input lag, ces écrans garantissent une latence particulièrement basse, idéale pour les jeux esports. De plus, cette prouesse ne repose pas sur des dalles de types TN qui sont généralement les plus rapides, mais sur des dalles de types IPS qui ont un bien meilleur rendu des couleurs.

Sur les écrans G-Sync 360 Hz se trouve un HUB équipé de deux ports USB. On peut y brancher n’importe quel périphérique, mais c’est aussi là qu’il faudra brancher la souris certifiée NVIDIA pour profiter des fonctionnalités supplémentaires. Une fois branchée, la fonctionnalité s’activera depuis l’OSD de l’écran et à chaque action de la souris sa latence sera mesurée et affichée. De même, la latence du système complet est mesurée. Ci-dessous notre test dédié à la technologie NVIDIA Reflex Latency Analyzer.

Test : ASUS ROG Swift PG259QNR et NVIDIA Reflex Latency Analyzer

Passons à la suite et commençons avec les benchmarks sous 3DMark et compagnies.

Lire la suite

7 Commentaires

Charles 21 novembre 2020 à 11 h 52 min

Sympa le détail du relief sur les ventilateurs

La boite n’a effectivement rien a voir avec Msi , on aurai dit une boite iChill ou HoF !

Répondre
hervé 21 novembre 2020 à 12 h 47 min

Bonjour
c’est vraiment bien tous les jours pratiquement de nouvelles cartes sorte, mais moi ça commence franchement à me saouler, on ne peut que les regarder impossible d’en acheter une que ce soit NVIDIA ou AMD alors maintenant s’il commençait seulement à approvisionner cela serait bien.

Répondre
yohan 21 novembre 2020 à 19 h 04 min

Vs êtes pas au courant ? Cette génération de cartes est juste pour les journalistes ou pseudo journalistes d’une compétence incroyable!! parceque là l’article j’aurai pu le faire moi même en regardant derrière la boîte ! Faites plutôt des articles intéressants sur le râle bol de la non disponibilité des cartes !! Vs servirez à quelque chose pour une fois !!

Répondre
Aymeric 24 novembre 2020 à 15 h 06 min

Bonjour,

Pouvez vous faire un comparatif entre la MSI RTX 3080 Suprim et la MSI RTX 3080 Gaming Trio X ?

En dehors de la finition esthétique en alu, apporte t-elle vraiment quelque chose en terme de performances ?

Je serais intéressé de voir un benchmark en jeu des 2 cartes, par exemple sur Assassin’s Creed Valhalla 😉

Répondre
Bedouille69 25 décembre 2020 à 16 h 58 min

Hello,

J’ai la carte depuis quelques jours en BIOS gaming et je remarque que les ventilos passent de 70% à 100% une fois que la carte atteint 70 degrés. La seule solution est de faire une courbe perso avec Afterburner et je ne comprends pas pourquoi ça fait ça.

Merci.

Répondre
Fatal Rafale 16 avril 2021 à 18 h 21 min

Bizarre vous parlez de 10Gb Ram Alors que sur la mienne et sur le cartons etc etc il est bien écris 24Gb et meme dans mes benchmark

?????????????

Répondre
- Cyril Klein 16 avril 2021 à 18 h 53 min
  
  C’est que tu as une 3090 et pas une 3080 comme on test ici.
  
  Répondre

LAISSER UN COMMENTAIRE Annuler la réponse

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Test : be quiet! Dark Rock Pro 5 et Dark Rock…

Test : Alienware Aurora R16, moins extravagant, mais performant

Test : NVIDIA RTX 4080 SUPER Founders Edition

Test : PNY RTX 4080 SUPER VERTO OC

Guide : N-Key Rollover et Anti-Ghosting, des fonctionnalités clés, mais c’est…

Tuto : comment booster un PC portable en changeant la RAM…

Guide d’achat écran ASUS : quel écran pour mettre sous le…

Guide d’achat 2023 : les meilleurs routeurs ASUS

Guide d’achat pour les cadeaux de Noël de Razer

Build DeepCool : du PC gaming tout blanc et un i5-14600K…

Build be quiet! : on a monté le PC dernière génération…

Build NZXT : ELITE H9 White, une configuration gamer toute blanche…

Build HC : une configuration Mini-ITX full Phanteks

Test : MSI RTX 3080 SUPRIM X, le nouveau haut de gamme par MSI

Architecture Ampere

Processeur de Streaming

RT Cores et Tensor Cores

RTX IO

NVIDIA Reflex et Latency Analyzer

7 Commentaires

LAISSER UN COMMENTAIRE Annuler la réponse

Tuto Montage PC

Guide montage PC gamer : tout ce que vous devez savoir

Configuration de référence PC gaming petit budget

Configuration de référence : PC Gaming, budget 500 euros

Les derniers tests

Test : be quiet! Dark Rock Pro 5 et Dark Rock Elite

Test : Alienware Aurora R16, moins extravagant, mais performant

Architecture Ampere

Processeur de Streaming

RT Cores et Tensor Cores

RTX IO

NVIDIA Reflex et Latency Analyzer

7 Commentaires

LAISSER UN COMMENTAIRE Annuler la réponse

Suivez nous !

Tuto Montage PC

Configuration de référence PC gaming petit budget

Les derniers tests