NVIDIA được cho là đang có kế hoạch bắt đầu sản xuất hàng loạt GPU AI H20, được thiết kế dành riêng cho thị trường Trung Quốc, vào quý 2/2024 mà vẫn tuân thủ đầy đủ các chính sách hạn chế của Mỹ.
Vào tháng 11 năm ngoái, có thong tin cho rằng NVIDIA đang chuẩn bị một loạt GPU AI mới cho bán riêng tại Trung Quốc để thay thế cho các chip H100, L40 và L4 đã bị hạn chế do chính sách. Giờ đây, những con chip mới nhất phải được sản xuất hoàn toàn tuân thủ các chính sách thương mại/xuất khẩu của Mỹ.
Về thông số kỹ thuật, GPU AI H20 là biến thể rút gọn của GPU H100 có dung lượng bộ nhớ 96 GB hoạt động với tốc độ lên tới 4,0 Tb/s, 296 TFLOPs công suất tính toán và sử dụng khuôn GH100 với mật độ hiệu suất là 2,9 TFLOP/khuôn so với 19,4 của H100.
H100 SXM nhanh hơn 6,68 lần so với H20 SXM theo bảng được liệt kê nhưng đó là FLOP lõi Tensor FP16 chứ không phải FLOP INT8 hoặc FP8. GPU có TDP 400W và có cấu hình 8 hướng trong giải pháp HGX. Nó vẫn giữ kết nối NVLINK 900 GB/s và cũng cung cấp chức năng MIG (GPU đa phiên bản) 7 hướng.
- NVIDIA H100 SXM TF16 (Sparsity) FLOPS = 1979
- NVIDIA H20 SXM TF16 (Sparsity) FLOPS = 296
Những con chip này dự kiến ra mắt vào cuối năm 2023 nhưng bị hoãn đến đầu năm 2024 khi cuộc chiến chip Mỹ-Trung nóng lên. Kể từ đó, chính phủ Mỹ đã áp dụng cách tiếp cận linh hoạt hơn đối với hoạt động mua bán thương mại ở Trung Quốc, và NVIDIA đã đảm bảo rằng chip của họ sẽ đáp ứng đầy đủ sự tuân thủ và hướng dẫn do các cơ quan thương mại và thương mại Mỹ đặt ra, điều này đã dẫn đến việc ra mắt GeForce RTX 4090D trong khu vực.
Công ty hiện đang mong muốn bắt đầu sản xuất hàng loạt H20 và phần còn lại của GPU AI vào quý 2 năm 2024. Các công ty AI Trung Quốc đang tái sử dụng số GPU GeForce RTX 4090 còn lại cuối cùng để sử dụng trong khi các công ty khác đang xem xét các lựa chọn thay thế như Huawei, công ty cung cấp giá trị hiệu suất/giá cả rất hấp dẫn trong phân khúc AI. Huawei dự kiến sẽ giành được thị phần lớn ở nước này từ những hạn chế đối với các công ty công nghệ có trụ sở tại Mỹ.