Wskaźniki wydajności Intel Arc Pro B70: znacznie szybszy niż RTX 4000 Pro Nvidii za połowę ceny i 33% więcej pamięci VRAM

Intel zaprezentował wczoraj Wysokowydajne procesory graficzne Arc Pro B65 i B70 dla stacji roboczych przeznaczone do szkolenia / wnioskowania AI LLM bez podawania konkretnych informacji o wydajności w początkowej informacji prasowej. Kilka godzin później firma opublikowała wykresy wydajności, które porównują model B70 do procesorów graficznych RTX 4000 Pro firmy Nvidia, które mają już kilka lat. Intel argumentuje, że porównanie to jest nadal aktualne, biorąc pod uwagę cenę karty B70 poniżej 1000 USD, a Team Blue popiera to imponującymi twierdzeniami dotyczącymi ogólnej wydajności.
Nawet bez patrzenia na wykresy wydajności, które mogą, ale nie muszą być dokładne w prawdziwym stylu Intela, GPU Arc B70 natychmiast wznosi się ponad konkurencję Nvidii dzięki zwiększonej pojemności pamięci VRAM (32 GB w porównaniu do 24 GB) i cenie początkowej, która zaczyna się od 949 USD (w porównaniu do 1800 USD). Co prawda, pamięć VRAM to tylko 19 Gb/s GDDR6 z 256-bitową magistralą i przepustowością 608 GB/s, ale przynajmniej zwiększona pojemność pomaga w trenowaniu i wnioskowaniu na większych modelach.
Dzięki większej pojemności pamięci VRAM, B70 może pochwalić się 2,2-krotnie większym oknem kontekstowym w porównaniu do karty RTX 4000 Pro. Slajd Intela pokazuje, że B70 obsługuje kontekst o długości do 93 tys. tokenów w porównaniu do RTX 4000 Pro, któremu kończy się pamięć przy maksymalnie 42 tys. tokenów, gdy jest używany z modelem Llama 3.1 8b Model BF16.
Równoległe przepływy wieloagentowe działające na modelu Ministral Instruct 2410 8B (BF16) zapewniają o 85% wyższą przepustowość tokenów dla wielu użytkowników lub żądań z B70 w środowisku Linux OS. Dodatkowo, B70 jest w stanie generować szybsze odpowiedzi dla wielu użytkowników lub żądań z 6,2x krótszym czasem do pierwszego tokena, a Intel wspomina, że te doskonałe prędkości są możliwe dzięki ulepszonemu oneAPI firmy i zastrzeżonemu stosowi oprogramowania. Wzrost wydajności w porównaniu do konkurencji Nvidii skaluje się również z konfiguracjami z wieloma GPU, ponieważ Intel twierdzi, że wzrost do 2x tokenów za dolara w konfiguracjach z jednym, dwoma i czterema GPU.
Niestety, slajdy nie pokazują żadnych wskaźników wydajności ani informacji o cenie dla B65 GPU. Ciekawie byłoby zobaczyć, czy Intel pozwoli partnerom AIB na wypuszczenie zorientowanych na gry wersji procesorów graficznych B65 i B70 z nieco mniejszą pojemnością pamięci VRAM. Oznaczałoby to również, że Intel musi dostarczyć ulepszone sterowniki graficzne.












