Notebookcheck Logo

Grok 4 pokonuje ChatGPT, aby stać się najlepszym publicznym modelem sztucznej inteligencji, gdy Elon Musk zachwala subskrypcję premium za 300 USD miesięcznie

Logo modelu językowego Grok 4 AI. (Źródło obrazu: xAI)
Logo modelu językowego Grok 4 AI. (Źródło obrazu: xAI)
Nowy Grok 4 firmy xAI Elona Muska jest obecnie najlepszym modelem sztucznej inteligencji dostępnym publicznie, według zewnętrznych platform testowych, pokonując ChatGPT lub Google Gemini. Zespół xAI wprowadził również nową i kosztowną opcję subskrypcji AI o nazwie Grok 4 Heavy.
AI Business

Nieco ponad dwa lata po premierze, Grok firmy xAI stał się wiodącym modelem językowym sztucznej inteligencji, przewyższając ChatGPT OpenAI, Gemini Google czy DeepSeek, a także Meta i Anthropic. Grok trafi do samochodów Tesli w przyszłym tygodniu, powiedział Elon Musk.

Według niezależnych testów zewnętrznych, nowo wydany Grok 4 znalazł się na szczycie publicznej tabeli wydajności modeli AI. Siłą napędową 10-krotnej poprawy rozumowania między Grok 3 i Grok 4 były klastry obliczeniowe sztucznej inteligencji, które xAI zbudowało z zawrotną prędkością, podwajając je do 200 000 procesorów graficznych w drodze do planowanego miliona.

Zespół xAI skontaktował się z ludźmi stojącymi za wymagającym testem wydajności ARC-AGI i poprosił ich o uruchomienie swoich zestawów testów sztucznej inteligencji, uzyskując zaskakujące wyniki:

Najpierw fakty: Grok 4 jest obecnie najlepszym publicznie dostępnym modelem w ARC-AGI. Przewyższa on nawet specjalnie stworzone rozwiązania przesłane na Kaggle. Po drugie, ARC-AGI-2 jest trudne dla obecnych modeli AI. Aby uzyskać dobry wynik, modele muszą nauczyć się mini-umiejętności z serii przykładów szkoleniowych, a następnie zademonstrować tę umiejętność w czasie testu. Poprzedni najlepszy wynik wynosił ~ 8% (Opus 4). Poniżej 10% jest szum. Uzyskanie 15,9% przełamuje tę barierę hałasu, Grok 4 wykazuje niezerowy poziom płynnej inteligencji

Inny niezależny tester sztucznej inteligencji, Artificial Analysis, powiedział, że

"uruchomił nasz pełny zestaw testów porównawczych i Grok 4 osiągnął indeks inteligencji sztucznej analizy na poziomie 73, wyprzedzając OpenAI o3 na poziomie 70, Google Gemini 2.5 Pro na poziomie 70, Anthropic Claude 4 Opus na poziomie 64 i DeepSeek R1 0528 na poziomie 68"

Według Elona Muska w prezentacji Grok 4, model xAI jest teraz mądrzejszy niż wszyscy absolwenci wszystkich dyscyplin razem wzięci. W typowy dla siebie sposób, dyrektor generalny Tesli twierdził, że Grok 4 będzie w stanie odkryć "nowe technologie", takie jak leki lub przełomowe rozwiązania inżynieryjne.

Mimo to przyznał, że Grok nadal będzie kiepski w rozpoznawaniu obrazów przez około miesiąc i odniósł się do ostatnich supremacjonistycznych odpowiedzi kontrowersja mówiąc, że"kiedy Grok idzie źle, zwykle jest to spowodowane czymś głupim, co zrobiliśmy, na przykład złym monitem systemu lub zbyt dużym naciskiem na stronnicze źródła"

Musk musi pompować Grok 4, ponieważ jego xAI po raz pierwszy wprowadza płatną warstwę premium. Nazywa się SuperGrok Heavy, zaczyna się od 300 USD miesięcznie i obejmuje to, co znajduje się w warstwie SuperGrok za 30 USD miesięcznie, która daje początkowy dostęp do Grok 4, a także dostęp do platformy Grok 4 Heavy, która oferuje wyższe limity stawek i wczesny dostęp do nowych funkcji.

Grok 3 pozostanie darmowy dla ogółu społeczeństwa, podczas gdy każdy subskrybent X Premium+ będzie miał dostęp do Grok 4 w warstwie SuperGrok.

Historyczny wykres wydajności modeli Grok vs ChatGPT vs Gemini AI.
Historyczny wykres wydajności modeli Grok vs ChatGPT vs Gemini AI.
Ranking najlepszych modeli AI.
Ranking najlepszych modeli AI.

Źródło(a)

Please share our article, every link counts!
Mail Logo
> laptopy testy i recenzje notebooki > Nowinki > Archiwum v2 > Archiwum 2025 07 > Grok 4 pokonuje ChatGPT, aby stać się najlepszym publicznym modelem sztucznej inteligencji, gdy Elon Musk zachwala subskrypcję premium za 300 USD miesięcznie
Daniel Zlatev, 2025-07-10 (Update: 2025-07-10)