Test : MSI RTX 4090 SUPRIM X 24G, le haut de gamme est-il utile ?

Par

26 janvier 2023

Architecture Ada Lovelace

Face à Ampere que nous avions sur les cartes graphiques NVIDIA RTX 3000, nous avons de belles évolutions au niveau de l’architecture. En effet, pour commencer à parler avec les chiffres bruts, nous passons pour les plus gros GPU de ces générations de 7 à 12 GPS, de 42 à 72 TPC et de 84 à 144 SM. Quant aux CUDA Cores, nous passons de 10 752 à 18 432. Pour les RT Cores, nous passons de 84 à 144 en passant en plus de la seconde génération à la troisième. Pour les Tensor Cores ensuite, nous passons de 336 à 576 en passant de la troisième à la quatrième génération. La fréquence GPU passe de 1,9 à 2,5 GHz. Le nombre de transistors passe de 28 milliards à 76 milliards. Enfin, les GPU de cette génération ne sont plus gravés en 8 nm via Samsung Foundry, mais en 4 nm via TSMC.

Dans l’architecture Ada Lovelace et sur la plus grosse puce (qui sera pour la RTX 4090 Ti), nous avons 12 GPC qui contiennent chacun 12 TPC qui disposent chacun d’un SM. Ces SM d’ailleurs, sont annoncés comme deux fois plus performants.

Processeur de Streaming

L’un des aspects les plus importants de l’architecture Ada Lovelace repose sur les processeurs de streaming, alias les SM (streaming multiprocessors). Comme la génération précédente, alias Ampere, sur cette MSI RTX 4090 SUPRIM X on trouve des SM au nombre de 76 et contenant chacun 4 Tensor Cores. On obtient donc les 304 Tensor Cores. Sur le schéma ci-dessous on peut voir de quoi est constitué un SM. On y voit les 4 Tensor Cores de 4e génération, mais également que chaque unité dispose de 32 cœurs FP32 ((32*4)*76) = les 9 728 cœurs CUDA. Notez que parmi les 32 cœurs présents dans chacune des quatre unités que compose un SM, 16 d’entre eux peuvent effectuer simultanément des calculs INT32 et FP32.

RT Cores et Tensor Cores

Il faut tout d’abord noter que le nombre de RT Cores augmente face à la génération précédente puisque chaque SM contient un RT Cores et que nous passons maintenant à 76 SM, ce qui donne 76 RT Cores annoncés comme deux fois plus performants que la 3e génération. En effet, le débit d’intersection rayon-triangle est deux fois plus rapide que sur Ampere. Mais ces RT Cores comprennent également deux nouvelles unités matérielles. Nous avons en premier l’Opacity Micromap Engine et le deuxième est le Displaced Micro-Mesh Engine. Le premier permet par exemple aux développeurs de réaliser rapidement des effets d’opacités sur des objets de forme irrégulière (fougères et clôtures notamment) ou encore à des éléments translucides comme des flammes. Ce sont donc maintenant les RT Cores qui réalisent cet exercice et non plus le SM.

Maintenant pour la seconde nouvelle unité matérielle Displaced Micro-Mesh Engine. Ici, le but est de réduire le temps de construction de BVH et les exigences de stockage qui sont traditionnellement nécessaires lorsqu’on traite des objets complexes avec des niveaux de détails élevés de détails géométriques. Cette technologie permet de générer dynamiquement des micros-triangles supplémentaires au besoin lorsqu’un détail géométrique s’ajoute à un objet. Par rapport au rendu traditionnel de ces objets complexes, le Micro-Mesh Engine réduit le temps de construction de BVH par un facteur de 10 tout en réduisant les besoins de stockage de BVH par un facteur de 20.

Ada Lovelace introduit également le SER (Shader Execution Reordering). Cette technologie réorganise les charges de travail à la volée afin qu’elles puissent être traitées plus efficacement par les noyaux SM et RT. Cela permet de multiplier dans certains cas par deux ou trois les performances en Ray Tracing en activant le RT Overdrive dans les titres compatibles.

DLSS 3 : le Deep Learning Super Sampling de NVIDIA encore amélioré

Nous avons donc une nouvelle itération de la technologie DLSS si cher à NVIDIA avec le DLSS 3. Ici, la marque au caméléon annonce un gain de performance de l’ordre de 4 fois à ce que nous avons sans DLSS. Pour en arriver là, l’entreprise se repose notamment sur des Tensors Cores de quatrième génération, mais aussi des OFA (Optical Flow Accelerator).

Il faut aussi savoir que le DLSS 3 intègre directement la technologie NVIDIA Reflex permettant une latence diminuée dans les jeux compatibles. Est également pris en charge Frame Generation (via les OFA), une nouveauté du DLSS 3 ainsi que le Super Resolution, la nouveauté que nous avions dans le DLSS 2.

Concrètement : DLSS 3 = DLSS 2 + Frame Generation (OFA) + Reflex

Pour améliorer autant les performances, le DLSS 3 va analyser les images séquentielles et les données de mouvement à partir de ce nouvel accélérateur (OFA) afin de créer des images additionnelles. Par contre, ceci a pour effet d’augmenter la latence. C’est pour cette raison que l’activation du DLSS 3 active automatiquement Reflex, une technologie permettant de diminuer la latence en jeu. Vous verrez nos benchmarks sur ce point sur le titre Cyberpunk 2077 dans la page dédiée ainsi que sur le titre A Plague Tail: Requiem en conclusion.

En revanche, puisque le DLSS 3 se base sur de l’Optical Flow que nous ne trouvons que sur les RTX 4000, cette technologie n’est pas disponible avec d’autres cartes graphiques. Du moins pour l’instant. En effet, Bryan Catanzaro, vice-président de la recherche appliquée sur l’apprentissage profond chez NVIDIA, a évoqué la question sur Twitter. Ce dernier annonce qu’un support du DLSS 3.0 par les GeForce RTX 2000 et 3000 n’est pas totalement impossible :

« Il est théoriquement possible qu’avec des recherches et des développements supplémentaires, nous puissions faire fonctionner cette technologie sur d’autres cartes, mais cela n’apporterait pas autant d’avantages ».

Passons à la suite et commençons avec les benchmarks.

Lire la suite

1 COMMENTAIRE

Naya 18 mars 2023 à 23 h 46 min

Cette carte à un vbios limité comparé à la version liquid..
Sur reddit (nvidia) pas mal de personne on testé d’intervertir les bios de la liquid pour la aircooling cela semble bien fonctionner (toutes les sorties marchent correctement, ventilo’ aussi, pas de surchauffe des VRM, etc).
Mais bon cela reste du trifouillage surtout quand on paye un carte 2200€.. c’est pathétique venant de MSI et surtout incompréhensible pour une carte prenant plutôt bien les watt sans avoir à être refroidi par un système liquid.

Aircooling = 520w max
Liquid = 600w max

Les bios sont comme d’habitude disponible sur le site techpowerup donc à mon avis vous devriez parler de ce gros point négatif car les utilisateurs des 4090 suprim / Galax HoF / Asus Strix overclock dans une grande majorité des cas à différends niveaux donc les prévenir sur le power limit de leurs cartes peut-être pertinent pour un site d’information

Répondre

LAISSER UN COMMENTAIRE Annuler la réponse

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Test : ASUS ROG Moonstone Ace L, une glisse parfaite ?

Test : ASUSTOR Flashstor 6 FS6706T, un NAS spécial SSD M.2

Test : be quiet! Pure Loop 2 280, une bonne surprise…

Test : EKWB EK-Nucleus AIO CR360 Lux D-RGB, le must-have des…

Guide : N-Key Rollover et Anti-Ghosting, des fonctionnalités clés, mais c’est…

Tuto : comment booster un PC portable en changeant la RAM…

Guide d’achat écran ASUS : quel écran pour mettre sous le…

Guide d’achat 2023 : les meilleurs routeurs ASUS

Guide d’achat pour les cadeaux de Noël de Razer

Build DeepCool : du PC gaming tout blanc et un i5-14600K…

Build be quiet! : on a monté le PC dernière génération…

Build NZXT : ELITE H9 White, une configuration gamer toute blanche…

Build HC : une configuration Mini-ITX full Phanteks

Test : MSI RTX 4090 SUPRIM X 24G, le haut de gamme est-il utile ?

Architecture Ada Lovelace

Processeur de Streaming

RT Cores et Tensor Cores

DLSS 3 : le Deep Learning Super Sampling de NVIDIA encore amélioré

1 COMMENTAIRE

LAISSER UN COMMENTAIRE Annuler la réponse

Tuto Montage PC

Guide montage PC gamer : tout ce que vous devez savoir

Configuration de référence PC gaming petit budget

Configuration de référence : PC Gaming, budget 500 euros

Les derniers tests

Test : ASUS ROG Moonstone Ace L, une glisse parfaite ?

Test : ASUSTOR Flashstor 6 FS6706T, un NAS spécial SSD M.2

Architecture Ada Lovelace

Processeur de Streaming

RT Cores et Tensor Cores

DLSS 3 : le Deep Learning Super Sampling de NVIDIA encore amélioré

1 COMMENTAIRE

LAISSER UN COMMENTAIRE Annuler la réponse

Suivez nous !

Tuto Montage PC

Configuration de référence PC gaming petit budget

Les derniers tests