Nvidia wprowadza nową kartę graficzną Ampere, ale to nie ten model co myślisz
Ciągle czekamy na premierę (i dostępność!) kart graficznych do grania, ale w międzyczasie na rynku pojawiają się też ciekawe rozwiązania z profesjonalnego segmentu. Nvidia zaprezentowała właśnie akcelerator A2, który ma wspomóc obliczenia związane ze sztuczną inteligencją.
Nvidia A2 to podstawowa konstrukcja, która została zaprojektowana z myślą o centrach danych prowadzących obliczenia bazujące na sztucznej inteligencji (mowa tutaj głównie o przetwarzaniu danych, trenowaniu czy wnioskowaniu, więc dziedzinach wpływających na poprawę komfortu naszego życia).
Nvidia A2 – nowy model wypada dużo lepiej od poprzednika
Karta bazuje na układzie graficznym Nvidia Ampere GA107 z 1280 jednostkami CUDA, co przekłada się na 4,5 TFLOPS mocy obliczeniowej pojedynczej precyzji. Dodatkowo przewidziano tutaj 16 GB pamięci GDDR6 128-bit o przepustowości 200 GB/s.
Model | Nvidia A100 | Nvidia A30 | Nvidia A2 |
Generacja | Nvidia Ampere | Nvidia Ampere | Nvidia Ampere |
Układ graficzny | GA100 | GA100 | GA107 |
Rdzenie CUDA | 6912 | 3584 | 1280 |
Rdzenie Tensor | 432 | 224 | 40 |
Taktowanie Boost | 1,41 GHz | 1,44 GHz | 1,77 GHz |
Moc obliczeniowa pojedynczej precyzji | 19,5 TFLOPS | 10,3 TFLOPS | 4,5 TFLOPS |
Moc obliczeniowa podwójnej precyzji | 9,7 TFLOPS | 5,2 TFLOPS | 0,14 TFLOPS |
Pamięć VRAM | 80GB HBM2e 5120-bit | 24GB HBM2 3072-bit | 16GB GDDR6 128-bit |
Przepustowość pamięci | 2 TB/s | 933 GB/s | 200 GB/s |
TDP | 400 W | 165 W | 40 - 60 W |
Specyfikacja karty może nie należy do najmocniejszych, ale warto zwrócić uwagę na efektywność energetyczną konstrukcji – standardowy współczynnik TDP to 60 W, ale można go obniżyć do 40 W (akcelerator nie wymaga podłączenia dodatkowego zasilania).
Nvidia A2 to najsłabszy i najmniejszy przedstawiciel serii (w ofercie producenta są dostepne też większe i wydjaniejsze modele A30 i A100)
Warto dodać, że A2 to kompaktowa konstrukcja (HHHL-SS - niskoprofilowa, krótka i jednoslotowa), więc bez problemu zmieści się do serwerów. Do komunikacji wykorzystano interfejs PCI-Express 4.0 x8.
Na jaką wydajność można liczyć? Producent porównał nowy kartę Nvidia A2 do modelu Nvidia T4 z poprzedniej generacji Turing.
Nowy model oferuje o 20 – 30% lepsze osiągi w testach bazujących na akceleracji sztucznej inteligencji, ale przy okazji oferuje o 10% lepszą efektywność energetyczną i o 60% lepszy stosunek ceny do wydajności.
Producent nie zdradził szczegółów na temat dostępności akceleratora, ale teoretycznie powinien on być tańszy od swojego poprzednika (ten kosztuje około 10 000 złotych).
Źródło: Nvidia
Komentarze
9Ten układzik jest słabszy nawet od T4. Wbrew temu co pokazuje Nvidia na slajdzie. Wystarczy zerknąć na specyfikację:
https://www.nvidia.com/en-us/data-center/products/a2/
https://www.nvidia.com/en-us/data-center/tesla-t4/
NVIDIA T4 Specifications:
Turing Tensor Cores 320
NVIDIA CUDA® cores 2,560
Single Precision Performance (FP32) 8.1 TFLOPS
Mixed Precision (FP16/FP32) 65 FP16 TFLOPS
INT8 Precision 130 INT8 TOPS
INT4 Precision 260 INT4 TOPS
Gen3 x16 PCIe
Capacity 16 GB GDDR6
Bandwidth 320+ GB/s
70 W
Istny kabaret :-)