Badacz twierdzi, że gra „Fable 5” nadal pomaga w planowaniu cyberataków po swoim wielkim powrocie

Modele Fable 5 i Mythos 5 firmy Anthropic zostały zawieszone 12 czerwca 2026 r., po tym jak firma Anthropic poinformowała, że musi wprowadzić zmiany w celu dostosowania się do przepisów Departamentu Handlu Stanów Zjednoczonych dotyczących kontroli eksportu. Firma przywróciła dostęp do obu modeli sztucznej inteligencji 1 lipca, gdy Departament Handlu zniosł te ograniczenia, zgodnie z oświadczeniem samej firmy Anthropic.
Tego samego dnia badacz Alec Armbruster opublikował na blogu wpis, , w którym stwierdził, że model Fable 5 nadal jest skłonny pomagać w planowaniu cyberataków. Według Armbrustera już na kilka tygodni przed zawieszeniem odkrył on, że ten potężny nowy model można skłonić — przy użyciu podstawowych technik zamiast zaawansowanych metod obejścia zabezpieczeń — do pomocy w planowaniu wykorzystania znanych luk w zabezpieczeniach urządzeń IoT, które nie są lukami typu zero-day, co znacznie obniża poprzeczkę techniczną dla tego rodzaju ataków.
Po przywróceniu dostępu 1 lipca Armbruster twierdzi, że ponownie przetestował Fable 5 za pośrednictwem API Anthropic udostępnianego przez Cursor. Wykorzystał hipotetyczną konwencję sformułowania zapytania, przedstawiając je jako badania o charakterze obronnym, i twierdzi, że Fable 5 ponownie wygenerował szczegółowe wyniki dotyczące planowania botnetu, odwołujące się do rzeczywistych urządzeń IoT z domyślnymi danymi uwierzytelniającymi. Nie odnotowano żadnych widocznych zmian w zachowaniu modelu pod kątem bezpieczeństwa w porównaniu z okresem przed zawieszeniem.
Armbruster twierdzi również, że przeprowadził porównywalne testy z wykorzystaniem modeli GLM-5.2, GPT-5.5 oraz Claude Opus 4.8 i że modele te odmówiły wykonania zadania lub nie zdołały go zrealizować, w przeciwieństwie do modelu Fable 5 w dniu jego przywrócenia.
Należy pamiętać, że twierdzenia te pochodzą z jednego niezależnego wpisu na blogu i nie zostały niezależnie zweryfikowane ani potwierdzone przez firmę Anthropic. Opisane zrzuty ekranu i metodologia testów nie zostały potwierdzone przez innych badaczy, a firma Anthropic do momentu sporządzenia niniejszego artykułu nie udzieliła publicznej odpowiedzi na konkretne zarzuty.











