Le grand public ne connaît principalement que NVIDIA et AMD en tant que constructeur de cartes graphiques. Ceci qu’elles soient pour un usage bureautiques, gaming ou bien réservées aux professionnels. Mais d’autres sociétés sont également dans la partie en utilisation purement professionnelle. C’est le cas de la société Shanghai Tianshu Zhixin Semiconductor Co. Ltd. qui travaille depuis 2018 sur un nouvel accélérateur de calcul GPUGPU. En début d’année l’entreprise a annoncé que son GPU Big Island est en cours de développement. À peine trois mois plus tard, la société a officiellement annoncé qu’elle était entrée dans la production de masse en utilisant le nœud de processus 7 nm de TSMC. Le GPUGPU (General-Purpose Computing on Graphics Processing Units) Big Island de Tianshu Zhixin est entré en production.
Le GPU Big Island de Tianshu Zhixin bénéficie d’une gravure TSMC en 7 nm. Il intègre la technologie CoWoS (Chip On Wafer On Substrate). Il comporte 24 milliards de transistors. En termes de performances, il est annoncé 37 TFLOP de puissance de calcul en simple précision (FP32). Mais également jusqu’à 147 TFLOP de calculs FP16 / BF16.
Le tableau nous offre une partie des capacités de ce que peut donner Big Island face aux solutions AMD Instinct MI100 et NVIDIA A100. Il atteindra 317 TOPS en calculs INT32, 147 TOPS en calculs INT16 et 295 TOPS en calculs IN8 par seconde.
Solution | Iluvatar CoreX | AMD Instinct MI100 | NVIDIA A100 |
---|---|---|---|
GPU | Big Island | Arcturus | GA100 |
Transistors | 24 milliards | 50 milliards | 54 milliards |
Architecture | TBC | CDNA | Ampere |
FP32 Cores | TBC | 7680 | 6912 |
Memory | 32 Go HBM2 | 32 Go HBM2 | 40 Go / 80 Go HBM2 |
Memory Bandwidth | TBC | 1,2 To/s | 1,6 To/s / 2 To/s |
TDP | 300 W | 300 W | 250 W / 400 W |
Interface | PCIe x16 Gen4 | PCIe x16 Gen4 | PCIe X16 Gen4 / NVLINK |
Peak Performance | |||
FP64 | TBC | 11.5 TFLOPS | 9.7 TFLOPS |
FP32 | 37 TFLOPS | 23.1 TFLOPS | 19.5 TFLOPS |
– Matrix | – | 46.1 TFLOPS | – |
– Sparsity | – | – | 156 TFLOPS |
– Tensor | – | – | 312 TFLOPS |
FP16 | 147 TFLOPS | 184.6 TFLOPS | 312 TFLOPS |
BFLOAT16 | 147 TFLOPS | 92.3 TFLOPS | 312 TFLOPS |
– Sparsity | – | – | 624 TFLOPS |
INT8 | 295 TOPS | 184.6 TOPS | 624 TOPS |
— Sparsity | – | – | 1248 TOPS |
INT4 | TBC | 184.6 TOPS | 1248 TOPS |
— Sparsity | – | – | 2496 TOPS |
Pour le moment il reste cependant certaines inconnues comme la fréquence, le nombre de cores FP32, la bande passante mémoire, etc. Autant de données qui ne nous permettent pas de savoir où cette solution se situe face à celles d’AMD et NVIDIA.
Le GPU Big Island de Tianshu Zhixin serait présenté soit sous forme de cartes classiques PCIe Gen4 x16 soit sous forme de carte mezzanine standard.