Test : GIGABYTE RTX 3090 Ti GAMING OC 24G, de très belle performances

    Architecture Ampere

    L’architecture Ampere représente la deuxième génération de cartes graphiques RTX. Celle-ci améliore de l’ordre de 1,9 fois les performances par Watts comparativement à l’architecture précédente Turing. Voyons plus en détail comment cela a été réalisé. Nous avons un GPU GA102-350 de chez Samsung avec une finesse de gravure de 8 nm et qui intègre 28,3 milliards de transistors. Nous avons un TDP de 450 W et l’alimentation se fait en 16-pins (12+4 broches PCIe Gen5). Mais avant de partir dans les détails, refaisons le point sur les caractéristiques de cette RTX 3090 Ti face aux RTX 3090, 3080, 3080 Ti et 3070 Ti.

    RTX 3090 Ti RTX 3090 RTX 3080 Ti RTX 3080 RTX 3070 Ti
    GPU GA102-350 GA102-300 GA102-225 GA104-200 GA104-400
    GPU Clusters
    84
    82
    80
    68
    48
    Cœurs CUDA
    10752
    10496
    10240
    8704
    6144
    RT
    84
    82
    80
    68
    48
    Tensors/TMU
    3336
    328
    320
    272
    192
    ROP
    112
    112
    112
    96
    96
    Fréquence de base
    1560 MHz (référence)
    1395 MHz
    1365 MHz
    1440 MHz
    1580 MHz
    Fréquence Boost
    1860 MHz (référence)
    1695 MHz
    1665 MHz
    1710 MHz
    1770 MHz
    Mémoire
    24 GO GDDR6X
    24 GO GDDR6X
    12 GO GDDR6X
    10 GO GDDR6X
    8 GO GDDR6X
    Bus
    384-bit
    384-bit
    384-bit
    320-bit
    256-bit
    Fréquence mémoire
    21 Gbps
    19 Gbps
    19 Gbps
    19 Gbps
    19 Gbps
    Bande passante
    1008 GB/s
    936 GB/s
    912 GB/s
    760 GB/s
    608 GB/s
    TDP
    450W
    350W
    350W
    320W
    290W
    MSRP
    2249 euros
    1649 euros
    1269 euros
    759 euros
    649 euros

    Processeur de Streaming

    L’un des aspects les plus importants de l’architecture Ampere repose sur les processeurs de streaming, alias les SM (streaming multiprocessors). Comparativement à la génération précédente, alias Turing, les nouveaux SM offrent le double les performances en FP32. D’ailleurs, sur cette RTX 3090 Ti on trouve 84 SM contenant chacun 4 Tensor Cores. On obtient donc les 336 Tensor Cores. Sur le schéma ci-dessous on peut voir de quoi est constitué un SM. On y voit les 4 Tensor Cores, mais également que chaque unité dispose de 32 cœurs FP32 ((32*4)*84) = les 10 752 cœurs CUDA. Notez que parmi les 32 cœurs présents dans chacune des quatre unités que compose un SM, 16 d’entre eux peuvent effectuer simultanément des calculs INT32 et FP32.

    SM architecture Ampere

    RT Cores et Tensor Cores

    Il faut tout d’abord noter que le nombre de RT Cores augmente légèrement face à la RTX 3090 puisqu’on passe de 82 à 84. Comparativement à la génération précédente RTX 2000, il faut aussi prendre en compte que l’IPC a augmenté de 1,7 fois. La technologie Ray Tracing utilise tout particulièrement ces cœurs. Pour rappel, cette technologie qu’on appelle aussi souvent « RTX » consiste à traiter la lumière en temps réel dans les jeux pour apporter davantage de réalisme dans les ombres, reflets, etc. On en parle bien plus en détail dans notre test détaillé sur Minecraft RTX. Ce réalisme atteint un niveau impossible à égaler manuellement. Le contrecoup de cette technologie est sa très forte consommation en ressources graphiques et la chute inévitable des FPS.
    Pour pallier cela, les Tensor Cores entrent en jeu avec la technologie DLSS (Deep Learning Super Sampling) qui repose sur un réseau neuronal d’apprentissage et augmente les FPS. Cette technologie fonctionne via un algorithme d’Intelligence Artificielle qui conserve, voire améliore la qualité d’image dans certains cas comme nous l’avons déjà constaté. Ces Tensor Cores sont issus de la troisième génération et bénéficient d’un IPC 2,7 fois plus important comparativement à la génération précédente. C’est aussi cette technologie qui permet, entre autres, de jouer jusqu’en 8K avec une RTX 3090 Ti via un mode Ultra Performance selon NVIDIA.

    RT Core Ampere

    NVIDIA Reflex et Latency Analyzer

    Durant l’annonce de cette génération de GPU, NVIDIA a également présenté la technologie Reflex. Celle-ci permet de réduire la latence des jeux (Esports notamment) jusqu’à 50 %. Les premiers jeux prenant en charge NVIDIA Reflex sont : Valorant, Apex Legends, Call of Duty Warzone, Destiny 2 et bien sûr Fortnite. Les développeurs disposent d’APIs fournies par NVIDIA pour l’intégrer à leurs jeux. Du côté des utilisateurs cette technologie arrivera sous la forme d’une mise à jour du pilote GeForce. Notez que cela fonctionne non seulement avec les nouvelles RTX 3000 Series, mais également à partir des GTX 900, un aspect important à souligner. Pour rappel, la latence représente le laps de temps entre l’action, par exemple un clic sur la souris et le moment où l’action est affichée à l’écran.

    Niveau fonctionnement, le pilote travaille de concert avec le moteur du jeu pour optimiser les débits du rendu 3D. La file d’attente de rendu est réduite dynamiquement et moins d’images sont laissées en file d’attente. NVIDIA déclare que cette technologie permet de garder le GPU parfaitement synchronisé avec le CPU (file d’attente de rendu 1: 1).

    Sur le graphique ci-dessous, NVIDIA montre l’efficacité de sa technologie Reflex. Notez que sur la configuration de test il s’agit seulement d’une GTX 1660 SUPER avec un processeur Intel Core i9, le tout avec une définition 1080p. Dans les quatre jeux présentés, tous en profitent à plus ou moins grande échelle.

    Nvidia Reflex

    Avec NVIDIA Reflex, la marque a présenté un nouveau standard pour les moniteurs Esports : les écrans G-Sync 360 Hz avec la technologie NVIDIA Reflex Latency Analyzer. Cette dernière est intégrée via le module G-Sync de l’écran et permet de mesurer la latence d’un écran, d’une souris et du PC dans un jeu. Accompagnés d’un taux de rafraîchissement à 360 Hz qui réduit déjà naturellement l’input lag, ces écrans garantissent une latence particulièrement basse, idéale pour les jeux Esports. De plus, cette prouesse ne repose pas sur des dalles de types TN qui sont généralement les plus rapides, mais sur des dalles de types IPS qui ont un bien meilleur rendu des couleurs.

    Nvidia Reflex Latency Analyzer

    Sur les écrans G-Sync 360 Hz se trouve un HUB équipé de deux ports USB. On peut y brancher n’importe quel périphérique, mais c’est aussi là qu’il faudra brancher la souris certifiée NVIDIA pour profiter des fonctionnalités supplémentaires. Une fois branchée, la fonctionnalité s’activera depuis l’OSD de l’écran et à chaque action de la souris sa latence sera mesurée et affichée. De même, la latence du système complet est mesurée. Ci-dessous notre test dédié à la technologie NVIDIA Reflex Latency Analyzer.

    Test : ASUS ROG Swift PG259QNR et NVIDIA Reflex Latency Analyzer

    Passons à la suite et commençons avec les benchmarks sous 3DMark et compagnies.

    Lire la suite


    1 COMMENTAIRE

    LAISSER UN COMMENTAIRE

    S'il vous plaît entrez votre commentaire!
    S'il vous plaît entrez votre nom ici

    Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.