Chiński producent procesorów graficznych Moore Threads zorganizował konferencję dla deweloperów MUSA, na której zaprezentował swoją architekturę następnej generacji "Huagang" (lub "Flowerpot"). Architektura ta ma zostać uruchomiona w przyszłym roku i obejmie zarówno gry, jak i aplikacje AI. Konferencja nie zawierała jednak szczegółowych specyfikacji technicznych nadchodzącej architektury, ale mocno podkreślała twierdzenia dotyczące wydajności.
Nowy GPU do gier o nazwie "Lushan" zostanie zbudowany na architekturze Huagang i zastąpi obecne modele MTT S80 i S90. Firma deklaruje aż 15-krotny wzrost wydajności w renderowaniu gier AAA oraz 50-krotny wzrost wydajności w ray tracingu. Procesor graficzny będzie również wyposażony w sprzętowy silnik ray tracingu 2. generacji, a także pełną obsługę DirectX 12 Ultimate dla lepszej kompatybilności. Należy jednak pamiętać, że nie ma jeszcze dowodów na to, że którekolwiek z tych twierdzeń jest prawdziwe, więc najlepiej traktować je z przymrużeniem oka.
Jeśli chodzi o pamięć, oczekuje się, że GPU będzie oferować do 64 GB pamięci (wzrost z obecnych 16 GB GDDR6) obecnych 16 GB GDDR6 oferowanych w obecnych modelach). Firma twierdzi również, że 64-krotnie poprawi wydajność obliczeń AI, 16-krotnie w przetwarzaniu geometrii, 4-krotnie w wydajności wypełniania tekstur i 8-krotnie w atomowym dostępie do pamięci. GPU będzie również podobno wyposażony w nową zunifikowaną architekturę renderowania "UniTE" z dedykowanym blokiem sprzętowym AI. Okaże się jednak, czy te twierdzenia będą miały wartość.
Oprócz Lushan, firma zaprezentowała również GPU Huashan AI, który podobno ma konstrukcję dwuprocesorową z 9 modułami HBM. Firma twierdzi, że wydajność będzie porównywalna z procesorami graficznymi Nvidia Hopper i Blackwell, a przepustowość pamięci przekroczy B200 firmy Nvidia. Procesor graficzny AI będzie również obsługiwał obliczenia od FP4 do FP64 z zastrzeżonymi formatami (MTFP4, MTFP6, MTFP8) i będzie skalowalny do ponad 100 000 procesorów graficznych za pośrednictwem połączenia MTLink 4.0 o przepustowości 1314 GB/s. Firma deklaruje 50-procentowy wzrost gęstości obliczeniowej i 10-krotną poprawę wydajności w porównaniu do obecnych modeli.
Chociaż nie są dostępne żadne wersje demonstracyjne GPU dla gier, firma zaoferowała demo wydajności dla DeepSeek V3 na MTT S5000 (kolejny procesor graficzny, który zostanie wydany w przyszłym roku, ale nie jest częścią linii Huashan). GPU najwyraźniej osiągnął 1000 tokenów na sekundę w Decode i 4000 tokenów na sekundę w Prefill, pokazując, że jego wydajność nieznacznie wyprzedza linię Hopper Nvidii. Nadchodzące układy GPU pokazują dążenie Chin do samowystarczalności w zakresie GPU w obliczu ograniczeń eksportowych, a więcej szczegółów spodziewanych jest w nadchodzących miesiącach, gdy produkty będą zbliżać się do premiery.
Źródło(a)
Szybka technologia (w języku chińskim)







