Nvidia DGX Spark za 4000 USD wkracza na arenę kompaktowej sztucznej inteligencji
Nvidia wprowadziła na rynek DGX Spark jako pierwszą próbę stworzenia kompaktowych systemów sztucznej inteligencji. Stacja robocza wielkości komputera stacjonarnego jest zasilana przez Superchip GB10 firmy i może osiągnąć do 1 PFLOP w FP4. Nvidia pozycjonuje go jako "osobisty superkomputer AI", który może wspierać badaczy i programistów pracujących z modelami generatywnymi na dużą skalę.
Choć na papierze brzmi to świetnie, to jednak dość wysoka cena może być trudną do przełknięcia pigułką. DGX Spark został wyceniony na 4000 USD i wielu entuzjastów musi dokładnie rozważyć stosunek kosztów do korzyści.
AMD Strix Halo rzuca wyzwanie Nvidii pod względem stosunku ceny do wydajności
Wchodzi pretendent.
GMKtec jest producentem wydajnych mini PC. Niedawno firma zmierzyła się z własnym EVO-X2 przeciwko Nvidia DGX Spark i opublikowała wyniki. EVO-X2 jest zbudowany na procesorze AMD Ryzen AI Max+ 395 Strix Halo APU.
Według GMKtec, Strix Halo wyprzedził system DGX Spark w testach porównawczych wykorzystujących wiele dużych modeli językowych typu open source, w tym Llama 3.3 70B, Qwen3 Coder, GPT-OSS 20B i Qwen3 0.6B. System AMD oferował lepszą wydajność w zakresie szybkości generowania tokenów i opóźnienia pierwszej odpowiedzi.
GMKtec stwierdził, że jego mini PC EVO-X2 wyróżniał się niskimi opóźnieniami w obciążeniach związanych z wnioskowaniem w czasie rzeczywistym dzięki połączeniu układu CPU + GPU + NPU układu Ryzen i silnika sztucznej inteligencji XDNA 2. Superkomputer AI firmy Nvidia zamiast tego postawił na surową przepustowość.
Podobna moc za połowę ceny
Topowy model EVO-X2 kosztuje 2199 USD, czyli mniej więcej połowę ceny DGX Spark. Podczas gdy test GMKtec pokazuje, że konfiguracja Nvidii pozostaje sprzętem do pokonania w przypadku dużych modeli i operacji o wysokiej przepustowości, Strix Halo firmy AMD może oferować lepszą wartość dla programistów i entuzjastów sztucznej inteligencji pracujących ze sztuczną inteligencją na urządzeniu i obciążeniami wydajnymi pod względem tokenów.



