80 Go de mémoire HBM2E avec l’accélérateur NVIDIA A100 PCIe

    Lors de l’événement ISC 2021 de cette année, NVIDIA a annoncé une version mise à jour de son accélérateur A100. La carte NVIDIA A100 PCIe est toujours basée sur son GPU GA100, après une version au form factor SXM2 dotée de jusqu’à 80 Go de mémoire HBM2E voici la même chose, mais sous forme d’une carte PCIe double slot. Le GPU GA100 bénéficie du processus de gravure TSMC en 7 nm. On retrouve 6192 cœurs CUDA et 432 Tensor Cores.

    La carte pro NVIDIA A100 PCIe change de form factor avec 80 Go de mémoire HBM2E

    Le TDP a été grandement amélioré, passant de 400 W pour la version SXM2 à « seulement  » 250 W. Cette carte graphique A100 PCIe destinée aux professionnels est destinée aux calculs haute performance pour accélérer la formation d’algorithmes deeplearning.
    Elle dispose d’une énorme quantité de mémoire avec 80 Go de mémoire HBM2E. La bande passante de cette dernière atteint 2039 Go/s (Vitesse effective de 3186 Gbps), soit 484 Go/s de plus que la A100 40 Go.

    NVIDIA A100 PCIe 80 Go

    Dans le même temps, NVIDIA a également annoncé NVIDIA GPUDirect Storage, une technologie similaire à la technologie Microsoft DirectStorage. Cela permet aux applications d’accéder directement aux 80 Go de mémoire.

    NVIDIA GPUDirect Storage

    NVIDIA Compute Accelerator Series (Formely Tesla)
    A100 PCIe A100 SXM Tesla V100s Tesla V100 Tesla P100
    GPU 7nm GA100 7nm GA100 12nm GV100 12nm GV100 16nm GP100
    Die Size
    826 mm²
    826 mm²
    815 mm²
    815 mm²
    610 mm²
    Transistors
    54 billion
    54 billion
    21.1 billion
    21.1 billion
    15.3 billion
    SMs
    108
    108
    80
    80
    56
    CUDA Cores
    6912
    6912
    5120
    5120
    3840
    Tensor Cores
    432
    432
    640
    640
    NA
    FP16 Compute
    78 TFLOPS
    78 TFLOPS
    32.8 TFLOPS
    31.4 TFLOPS
    21.2 TFLOPS
    FP32 Compute
    19.5 TFLOPS
    19.5 TFLOPS
    16.4 TFLOPS
    15.7 TFLOPS
    10.6 TFLOPS
    FP64 Compute
    9.7 TFLOPS
    9.7 TFLOPS
    8.2 TFLOPS
    7.8 TFLOPS
    5.3 TFLOPS
    Boost Clock
    ~1410 MHz
    ~1410M Hz
    ~1601 MHz
    ~1533 MHz
    ~1480 MHz
    Bandwidth
    2039/1555 GB/s
    2039/1555 GB/s
    1134 GB/s
    900 GB/s
    721 GB/s
    Eff. Memory Clock
    3186/2430 Gbps
    3186/2430 Gbps
    2214 Gbps
    1760 Gbps
    1408 Gbps
    Memory Config.
    80/40 Go HBM2e
    80/40 Go HBM2e
    32 Go HBM2
    16/32 Go HBM2
    16 Go HBM2
    Memory Bus
    5120-bit
    5120-bit
    4096-bit
    4096-bit
    4096-bit
    TDP
    250 W
    400 W
    250 W
    300 W
    300 W
    Form Factor PCIe 4.0 SXM4 PCIe 3.0 SXM2 / PCIe 3.0 SXM

     

    LAISSER UN COMMENTAIRE

    Please enter your comment!
    Please enter your name here

    Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.