Mythos: model, którego Anthropic najpierw się przestraszył, a potem oddał ludziom

W kwietniu 2026 roku Anthropic zrobił rzecz w branży technologicznej niespotykaną. Firma ogłosiła, że zbudowała model sztucznej inteligencji tak potężny, iż postanowiła go nie udostępniać. Nazwała go Claude Mythos Preview i opisała jako narzędzie, które samodzielnie znajduje luki w każdym liczącym się systemie operacyjnym i każdej przeglądarce. Zamiast wypuścić go na rynek, zamknęła dostęp w wąskim gronie firm zajmujących się obroną krytycznej infrastruktury.

Dwa miesiące później ta sama firma zmieniła zdanie. 9 czerwca udostępniła publicznie model o tych samych korzeniach, opakowany w zestaw barier bezpieczeństwa, i nazwała go Claude Fable 5. Tego samego dnia trafił do aplikacji, do API i do milionów użytkowników na całym świecie.

Między tymi dwiema decyzjami rozgrywa się jedna z ciekawszych opowieści współczesnej technologii. O tym, co się dzieje, gdy twórca uznaje własne narzędzie za zbyt niebezpieczne, by je sprzedać, a po kilku tygodniach i tak znajduje na to sposób.

Czym właściwie jest „klasa Mythos"

Modele Claude układają się u Anthropica w hierarchię uporządkowaną według mocy i zastosowań. Najszybszy i najtańszy jest Haiku, w środku plasuje się Sonnet, a szczyt dotychczas zajmował Opus — model do najtrudniejszych zadań. Mythos to nowa kategoria, którą firma umieściła ponad klasą Opus. Sama nazwa odsyła do greckiego słowa oznaczającego opowieść, mit, narrację przekazywaną z ust do ust.

Klasę tę otworzył wspomniany Mythos Preview. To, co go wyróżniało, nie było jednak ani szybkością, ani elokwencją. Wyróżniała go zdolność do rozumowania nad cudzym kodem — wyszukiwania w nim błędów, składania ich w łańcuchy i pisania działających exploitów. W praktyce oznaczało to model, który w cyberbezpieczeństwie potrafił dorównać najlepszym ludzkim specjalistom, a często ich przewyższyć.

Anthropic od dawna ostrzegał, że taka chwila nadejdzie. Pisaliśmy o tym napięciu między rozwojem a kontrolą w tekście o regulacjach sztucznej inteligencji, gdzie regulatorzy próbują nadążyć za czymś, co przyspiesza szybciej niż prawo. Mythos pokazał, że problem przestał być teoretyczny.

Project Glasswing, czyli broń oddana obrońcom

Skoro model potrafi znajdować luki, można go użyć na dwa sposoby. Można nim atakować albo można nim łatać dziury, zanim zrobi to ktoś o złych intencjach. Anthropic wybrał drugą drogę i nazwał ją Project Glasswing.

Nazwa nie jest przypadkowa. Glasswing to motyl o przezroczystych skrzydłach, Greta oto, żyjący w lasach obu Ameryk. W kulturze symbolizuje przejrzystość i to, co widać na wylot. Projekt miał właśnie taki cel: prześwietlić oprogramowanie, na którym opiera się codzienne życie miliardów ludzi, i pokazać ukryte w nim słabości, zanim ktoś je wykorzysta.

Do współpracy stanęli giganci. Wśród partnerów założycielskich znaleźli się Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, NVIDIA i Palo Alto Networks, a obok nich rząd Stanów Zjednoczonych. Anthropic przeznaczył do stu milionów dolarów w kredytach na korzystanie z modelu oraz cztery miliony w bezpośrednich darowiznach dla organizacji zajmujących się bezpieczeństwem otwartego oprogramowania.

Wyniki przerosły zapowiedzi. W ciągu pierwszego miesiąca model wraz z około pięćdziesięcioma partnerami wykrył ponad dziesięć tysięcy luk o wysokim lub krytycznym poziomie zagrożenia. Cloudflare zgłosił dwa tysiące błędów, w tym czterysta poważnych, i zauważył, że odsetek fałszywych alarmów modelu jest niższy niż u ludzkich testerów.

Jednym z najgłośniejszych odkryć była luka w wolfSSL — bibliotece kryptograficznej używanej w miliardach urządzeń. Oznaczona jako CVE-2026-5194, pozwalała na sfałszowanie certyfikatów bezpieczeństwa. Atakujący mógłby dzięki niej postawić stronę udającą bank albo dostawcę poczty, a przeciętny użytkownik nie miałby jak się zorientować, że coś jest nie tak. Mythos Preview nie tylko znalazł tę dziurę, ale i samodzielnie zbudował exploit, który ją wykorzystywał.

Skala odkryć obnażyła przy okazji niewygodną prawdę o całej branży. Ludzka zdolność do segregowania, zgłaszania i łatania błędów po prostu nie nadąża za tempem, w jakim potrafi je wykrywać maszyna. Z ponad dwudziestu trzech tysięcy zgłoszeń, które model wstępnie sklasyfikował, zewnętrzne firmy zweryfikowały próbkę około tysiąca dziewięciuset. Ponad dziewięćdziesiąt procent okazało się trafnych.

Na początku czerwca Anthropic rozszerzył program o mniej więcej sto pięćdziesiąt nowych organizacji z ponad piętnastu krajów, w tym operatorów sieci energetycznych, wodociągów, szpitali i telekomunikacji. To branże, które wcześniej w Glasswing nie były reprezentowane, a których awaria oznacza realne ryzyko dla ludzkiego życia.

Symboliczne przedstawienie projektu Glasswing i ochrony infrastruktury cyfrowej — Project Glasswing miał wykorzystać możliwości modelu Mythos do wyszukiwania luk bezpieczeństwa w oprogramowaniu wykorzystywanym przez firmy i instytucje publiczne.
Ilustracja poglądowa: AI / faleinspiracji.pl / CC BY 4.0.

Fable 5, czyli Mythos dla wszystkich — ale z hamulcem

Już przy starcie Glasswing firma deklarowała, że chciałaby kiedyś oddać możliwości klasy Mythos wszystkim użytkownikom, pod warunkiem zbudowania wystarczająco mocnych zabezpieczeń. Premiera Claude Fable 5 jest realizacją tej obietnicy.

Sama nazwa kryje subtelny żart. Fable, czyli bajka, pochodzi od łacińskiego fabula, „to, co opowiadane", spokrewnionego z greckim mythos. Oba słowa znaczą w gruncie rzeczy to samo. Anthropic użył tej bliskości celowo: Fable 5 i Mythos 5 to ten sam model. Różni je wyłącznie warstwa bezpieczeństwa nałożona na jeden z nich.

Fable 5 dostał komplet barier. Mythos 5, dostępny tylko dla wybranych obrońców i dostawców infrastruktury, ma je częściowo zdjęte. Dla zwykłego użytkownika oznacza to dostęp do niemal pełni możliwości najpotężniejszego modelu firmy, z wyłączeniem kilku obszarów uznanych za zbyt ryzykowne.

Mechanizm działa nietypowo. Gdy klasyfikator wykryje, że pytanie dotyczy cyberbezpieczeństwa, biologii, chemii albo prób skopiowania modelu, odpowiedź nie zostaje zablokowana. Zamiast tego przejmuje ją Claude Opus 4.8, czyli kolejny w hierarchii, wciąż bardzo zdolny model. Użytkownik dostaje informację, że to się stało. Anthropic argumentuje, że taki „spadek o klasę niżej" jest dla odpytującego znacznie lepszym doświadczeniem niż zwykła odmowa. Według danych firmy ponad dziewięćdziesiąt pięć procent sesji w ogóle nie uruchamia tego przełączenia, a w pozostałych przypadkach klasyfikatory bywają nadgorliwe i blokują też pytania całkiem niewinne.

Co ten model naprawdę potrafi

Liczby z testów wyglądają imponująco, choć trzeba je czytać z pewnym dystansem, bo pochodzą głównie od samego producenta. Na benchmarku SWE-Bench Pro, który mierzy rozwiązywanie prawdziwych zadań inżynierskich z publicznych repozytoriów, Fable 5 osiągnął wynik 80,3 procent. Dla porównania Opus 4.8 zatrzymał się na 69,2 procent, a konkurencyjne modele wypadły znacznie niżej: według danych Anthropica GPT-5.5 uzyskał 58,6 procent, a Gemini 3.1 Pro 54,2 procent. Na trudniejszym teście FrontierCode firmy Cognition, sprawdzającym jakość kodu wedle standardów produkcyjnych, Fable 5 prowadził w stawce modeli frontierowych nawet przy średnim nakładzie obliczeń.

Jedną rzecz sam Anthropic przyznaje wprost. Najmocniejsza wersja modelu, czyli Mythos Preview bez nowych barier, na części benchmarków wciąż wypada nieco lepiej od Fable 5. Bariery bezpieczeństwa nie są więc darmowe. Płaci się za nie drobnym ułamkiem sprawności, a firma zdecydowała, że to cena warta zapłacenia w zamian za możliwość publicznego udostępnienia modelu.

Bardziej obrazowy jest przykład od firmy Stripe, która testowała model przed premierą. W kodzie liczącym pięćdziesiąt milionów linii w języku Ruby Fable 5 przeprowadził migrację obejmującą całą bazę w jeden dzień. Ten sam zespół ludzi potrzebowałby na to ponad dwóch miesięcy.

Model robi też postępy w widzeniu. Potrafi odczytać konkretne wartości z gęstych wykresów naukowych albo odtworzyć kod aplikacji wyłącznie na podstawie zrzutów ekranu. Anthropic chętnie przytacza tu anegdotę o grze. Wcześniejsze wersje Claude’a, żeby przejść Pokémon FireRed, potrzebowały skomplikowanego rusztowania z mapami i podpowiedziami. Fable 5 ukończył grę, widząc jedynie surowe klatki obrazu z ekranu.

Firma pokazała przy premierze cały zestaw takich pokazów sprawności. Model samodzielnie zbudował symulację Układu Słonecznego, wyprowadzając ruch planet z praw fizyki i przewidując na tej podstawie zaćmienia Słońca. Grał w Factorio, grę o budowaniu fabryk uwielbianą przez inżynierów, planując i stawiając zautomatyzowaną linię produkcyjną bez ludzkiej pomocy. Zaprojektował też kompletny model do druku 3D w przeglądarkowym edytorze CAD, który sam wcześniej napisał. To nie są zadania z jednego pytania i jednej odpowiedzi. To wielogodzinne, wieloetapowe procesy, w których model musi pamiętać, co zrobił przed chwilą, i wyciągać wnioski z własnych błędów.

Z punktu widzenia codziennego użytkownika ważniejsze jest co innego. Model utrzymuje uwagę w zadaniach ciągnących się przez miliony znaków tekstu i potrafi poprawiać własną pracę na podstawie notatek, które sam sobie zostawia. Im dłuższe i bardziej złożone zadanie, tym wyraźniejsza jego przewaga nad poprzednikami. To właśnie ta cecha, a nie pojedyncze rekordy w testach, odróżnia go najbardziej od tego, co znaliśmy jeszcze rok temu. O tym, jak gwałtownie modele językowe weszły do codziennej pracy, pisaliśmy zresztą w retrospektywie kiedy AI przestała być eksperymentem.

System sztucznej inteligencji analizujący ogromne ilości kodu źródłowego — Jednym z głównych zastosowań klasy Mythos było automatyczne wykrywanie błędów i podatności w kodzie źródłowym.
Ilustracja poglądowa: AI / faleinspiracji.pl / CC BY 4.0.

Trzy bariery: cyber, biologia, kopiowanie

Warstwa bezpieczeństwa Fable 5 opiera się na osobnych systemach zwanych klasyfikatorami. To odrębne modele, których jedynym zadaniem jest wyłapywanie potencjalnych nadużyć, w tym prób obejścia zabezpieczeń, zanim główny model w ogóle odpowie. Anthropic wymienia trzy obszary, które one obejmują.

Pierwszy to cyberbezpieczeństwo. Tu logika jest najprostsza: skoro model potrafi znajdować i wykorzystywać luki, ta sama umiejętność w niepowołanych rękach obniża koszt i próg wejścia do prawdziwego ataku. Klasyfikatory mają objąć nie tylko samo pisanie exploitów, ale i szersze działania ofensywne — rozpoznanie celu, poruszanie się po sieci ofiary, eskalację. Według danych firmy w trybie blokującym model nie robił na tych zadaniach żadnych postępów.

Drugi obszar to biologia i chemia. Wcześniej Anthropic blokował tylko wąski wycinek pytań dotyczących broni biologicznej. Teraz uznał, że to za mało, bo modele zyskały realną zdolność wykonywania zadań naukowych. Firma testowała na przykład przewidywanie, jak modyfikacja genetyczna wpłynie na budowę otoczki wirusa. Ta sama umiejętność, która przydaje się w terapiach genowych, w złych rękach mogłaby posłużyć do projektowania niebezpiecznych patogenów. Dlatego na razie większość pytań z tego pola Fable przekierowuje do Opusa.

Trzeci, najmniej oczywisty, to dystylacja. Tym terminem określa się próby „wyciągnięcia" zdolności modelu po to, by wytrenować na nich konkurencyjny system. Anthropic wykrywał już zorganizowane akcje tego typu, prowadzone z państw autorytarnych. Obawa jest taka, że skopiowanie umiejętności Fable mogłoby rozsiać niemal pełne możliwości frontierowej AI po świecie, tyle że bez żadnych zabezpieczeń.

Skuteczność tych barier firma sprawdzała ostro. Poza testami wewnętrznymi uruchomiła zewnętrzny program nagród za znalezienie dziury, w którym ponad tysiąc godzin prób nie przyniosło żadnego uniwersalnego sposobu na obejście zabezpieczeń. Anthropic uczciwie dodaje przy tym, że brytyjski instytut badający bezpieczeństwo AI zdążył w krótkim oknie testowym poczynić w tym kierunku pewne postępy. Całkowite wyeliminowanie takich luk jest, jak przyznaje firma, prawdopodobnie niemożliwe.

Dwa zaawansowane systemy AI oddzielone warstwą zabezpieczeń — Claude Fable 5 i Mythos 5 opierają się na tym samym modelu bazowym, różniąc się przede wszystkim poziomem zastosowanych zabezpieczeń.
Ilustracja poglądowa: AI / faleinspiracji.pl / CC BY 4.0.

Cisza wokół danych

Przy okazji premiery Anthropic wprowadził też zmianę, która łatwo umyka w nawale benchmarków, a dotyka czegoś dla wielu firm wrażliwego. Dla Fable 5, Mythos 5 i przyszłych modeli o podobnym lub wyższym poziomie zdolności firma narzuca trzydziestodniowe przechowywanie całego ruchu, i to zarówno na własnych zasobach, jak i u partnerów zewnętrznych.

Brzmi to wbrew dotychczasowej narracji o prywatności, więc rozłóżmy rzecz na czynniki. Anthropic zapewnia, że tych danych nie użyje do trenowania nowych modeli ani do żadnego celu niezwiązanego z bezpieczeństwem. Każdy dostęp człowieka do nich ma być rejestrowany, a same dane usuwane po trzydziestu dniach w niemal wszystkich przypadkach. Po co zatem je w ogóle gromadzić?

Logika jest obronna. Najgroźniejsze ataki na zabezpieczenia modelu nie rozgrywają się w jednym pytaniu. Rozkładają się na wiele żądań, czasem pozornie niewinnych z osobna, które dopiero razem składają się w próbę obejścia barier. Bez wglądu w historię ruchu firma nie ma jak wykryć takiego rozproszonego ataku ani odróżnić go od zwykłego korzystania. Trzydziestodniowe okno ma być kompromisem między tą potrzebą a prawem użytkownika do tego, by jego rozmowy nie żyły wiecznie na cudzych serwerach.

Dla użytkownika biznesowego z Polski czy Europy to sygnał, że najpotężniejsze modele wchodzą w fazę, w której bezpieczeństwo zaczyna ważyć więcej niż wygoda i poufność. Im więcej model potrafi, tym ściślejszy nadzór nad jego użyciem jego twórca uznaje za konieczny.

Mythos 5 i obietnica leków

Wersja bez cyberhamulców, Mythos 5, trafia na razie wyłącznie do partnerów Glasswing i, w planach, do wąskiej grupy badaczy nauk o życiu. To właśnie tam pojawiają się najśmielsze deklaracje.

W projektowaniu białek wewnętrzni eksperci Anthropica mieli przyspieszyć pewne etapy prac około dziesięciokrotnie. Model, wyposażony w narzędzia bioinformatyczne, ale bez pomocy człowieka, dorównywał wykwalifikowanym operatorom: sam wybierał miejsca wiązania, dobierał i uruchamiał narzędzia, podnosił się po nieudanych próbach. Z czternastu badanych celów białkowych dziewięć dało obiecujących kandydatów do dalszych prac nad lekami.

Jeszcze ciekawszy jest wątek hipotez naukowych. Anthropic twierdzi, że Mythos 5 to pierwszy jego model, który konsekwentnie wymyśla nowe, sensowne hipotezy z biologii molekularnej. W ślepych porównaniach naukowcy firmy woleli pomysły modelu od pomysłów modeli klasy Opus mniej więcej w czterech przypadkach na pięć. Jedna z tych hipotez, dotycząca nieznanego wcześniej mechanizmu pewnego białka bakterii E. coli, została potwierdzona w niezależnym badaniu innego zespołu.

W genomice model przez ponad tydzień pracował w dużej mierze samodzielnie. Złożył dane dla milionów komórek ze stu trzydziestu ośmiu gatunków zwierząt, a następnie zaprojektował i wytrenował własny model uczenia maszynowego do rozpoznawania komórek pełniących tę samą rolę u odległych ewolucyjnie organizmów. Przy minimalnym udziale człowieka jego model pokonał rozwiązanie opublikowane niedawno w prestiżowym „Science", choć był od niego sto razy mniejszy.

Tu jednak należy zachować ostrożność. Wszystkie te wyniki pochodzą od firmy, która ma w nich interes i przygotowuje się do wejścia na giełdę. Żadne z tych danych nie zostały na razie poddane niezależnemu audytowi. Brzmią obiecująco, ale są to liczby producenta, nie recenzentów.

Cień nad premierą

Najdziwniejsze w tej całej historii jest to, co działo się tuż przed udostępnieniem modelu. Pięć dni wcześniej, 4 czerwca, Anthropic opublikował tekst zatytułowany „Kiedy AI buduje samo siebie". Autorzy, Marina Favaro i Jack Clark, wezwali w nim czołowe laboratoria do rozważenia skoordynowanego spowolnienia, a może nawet czasowej pauzy w rozwoju najpotężniejszych systemów.

Argument firmy brzmiał niepokojąco konkretnie. Modele zbliżają się do progu, który Anthropic nazywa rekurencyjnym samodoskonaleniem, czyli sytuacji, w której AI samodzielnie projektuje i trenuje swoich następców, bez człowieka kierującego każdym krokiem. Jako dowód firma podała własne dane: w maju 2026 roku ponad osiemdziesiąt procent kodu trafiającego do jej repozytorium napisał Claude, a nie ludzcy inżynierowie. Statystyczny pracownik Anthropica wysyła dziś do produkcji około ośmiokrotnie więcej kodu na kwartał niż w latach 2021–2024. Długość zadań, które model wykonuje samodzielnie, podwaja się mniej więcej co cztery miesiące.

I tak oto powstała scena trudna do uwierzenia. Firma, która we wtorek wypuszcza najpotężniejszy publicznie dostępny model w swojej historii, zaledwie pięć dni wcześniej apeluje do całej branży, by zwolniła, bo robi się niebezpiecznie. Nie wszyscy odebrali to jako szczerość. Część komentatorów zauważyła, że wezwanie do globalnej pauzy tuż przed wejściem na giełdę, przy wycenie sięgającej biliona dolarów, zamroziłoby rynek dokładnie w chwili, gdy Anthropic należy już do ścisłej czołówki. Trudno o lepszy moment na zatrzymanie konkurentów niż ten, w którym samemu się prowadzi.

Można na to spojrzeć łagodniej. Te dwa ruchy nie muszą się wykluczać. Firma może jednocześnie sądzić, że technologia jest cenna i warta udostępnienia, i że tempo jej rozwoju wymyka się społecznej kontroli. Cała konstrukcja Fable 5, z barierami przekierowującymi pytania do słabszego modelu, jest właśnie próbą pogodzenia tych dwóch przekonań. Czy udaną, pokażą dopiero kolejne miesiące i pierwsze poważne próby obejścia zabezpieczeń.

Liczy się też to, kim Anthropic chce być w oczach reszty świata. Firma od początku budowała wizerunek laboratorium ostrożnego, stawiającego bezpieczeństwo nad tempem. Na początku roku odmówiła amerykańskiemu wojsku zgody na wykorzystanie swoich modeli do nadzoru wewnętrznego i w pełni autonomicznej broni. Reakcja była ostra: rząd umieścił firmę na liście zastrzeżeń dotyczących bezpieczeństwa narodowego, która ma wejść w życie później w 2026 roku. Apel o spowolnienie wpisuje się więc w spójną, choć kosztowną linię, którą firma prowadzi od dawna.

Drugie tło jest finansowe. Anthropic domknął właśnie rundę finansowania wyceniającą go w okolicach biliona dolarów i złożył poufny wniosek o wejście na giełdę. Premiera najpotężniejszego modelu, równolegle z apelem o globalną pauzę, rozgrywa się więc na oczach inwestorów. Sceptycy widzą w tym wyrachowanie, zwolennicy szczerą troskę. Najuczciwsza odpowiedź brzmi prawdopodobnie tak: jedno nie wyklucza drugiego, a sama firma być może nie potrafiłaby tych motywów rozdzielić nawet przed samą sobą.

Futurystyczne miasto korzystające z infrastruktury wspieranej przez sztuczną inteligencję — Coraz potężniejsze modele AI mogą w przyszłości wspierać funkcjonowanie infrastruktury krytycznej, ochrony zdrowia i systemów komunikacyjnych.
Ilustracja poglądowa: AI / faleinspiracji.pl / CC BY 4.0.

Co to oznacza dla zwykłego użytkownika

Większość ludzi nie projektuje białek ani nie skanuje bibliotek kryptograficznych. Dla nich pytanie brzmi prościej: czy coś się zmieni przy codziennym pisaniu maila, analizie tabeli albo budowaniu prostej aplikacji.

Najprawdopodobniej tak, i to na lepsze. Skoro ponad dziewięćdziesiąt pięć procent zwykłych rozmów nie uruchamia żadnego przekierowania, użytkownik dostaje pełnię możliwości najmocniejszego modelu. Różnica będzie najbardziej widoczna w zadaniach długich i złożonych, ciągnących się przez wiele kroków, gdzie wcześniejsze modele gubiły wątek.

Jest jednak druga strona tej ostrożności. Klasyfikatory bywają nadgorliwe, a Anthropic uczciwie to przyznaje. Programista pytający o całkiem legalne kwestie bezpieczeństwa sieci albo student biologii szukający pomocy w zrozumieniu materiału mogą czasem trafić na przekierowanie do słabszego modelu, mimo że ich intencje są niewinne. Firma zapowiada stopniowe zawężanie tych barier, w miarę jak nauczy się lepiej odróżniać realne zagrożenie od fałszywego alarmu. Na razie jednak zasada brzmi: lepiej zablokować dziesięć niewinnych pytań niż przepuścić jedno groźne.

Jest jednak haczyk natury praktycznej, i to dwojaki. Po pierwsze, cena. Fable 5 i Mythos 5 kosztują dziesięć dolarów za milion tokenów wejściowych i pięćdziesiąt za milion wyjściowych. To mniej niż połowa ceny Mythos Preview, ale wciąż najdroższa oferta wśród liczących się modeli na rynku.

Po drugie, dostępność w abonamentach jest na starcie pokręcona. Od premiery do 22 czerwca Fable 5 jest wliczony w plany Pro, Max, Team i część firmowych bez dopłaty. 23 czerwca firma wyłączy go z tych pakietów, a dalsze korzystanie będzie wymagało osobnych kredytów. Anthropic zapowiada, że gdy tylko pozwoli na to moc obliczeniowa, przywróci model jako standardowy element subskrypcji. Powód tej ostrożności jest prozaiczny: firma spodziewa się ogromnego i trudnego do przewidzenia popytu.

Tę premierę najlepiej osadzić w szerszym wyścigu. Anthropic nie działa w próżni — równolegle do giełdy szykuje się OpenAI, a stawkę napędzają Google ze swoim Gemini oraz mniejsi gracze. Każde takie laboratorium ściga się o te same talenty, tę samą moc obliczeniową i tych samych klientów korporacyjnych. W tym kontekście udostępnienie modelu klasy Mythos jest ruchem strategicznym, nie tylko technologicznym. Kto pierwszy odda użytkownikom możliwości, o których konkurencja dopiero mówi, zyskuje przewagę trudną do nadrobienia. Premiera Fable 5 jest właśnie taką próbą: dowodem, że Anthropic potrafi ostrzegać przed ryzykiem, a zarazem przekuwać najgroźniejsze własne narzędzie w produkt, który da się sprzedać bez utraty twarzy.

Dla polskiego czytelnika płynie z tego jeszcze jedna obserwacja. Debata o tym, kto i na jakich zasadach ma dostęp do najpotężniejszych narzędzi AI, przestaje być abstrakcją zza oceanu. Te same modele, które dziś w wąskim gronie łatają wodociągi i sieci energetyczne w piętnastu krajach, jutro mogą decydować o tym, jak szybko europejskie firmy nadrobią dystans do amerykańskich gigantów. Pytanie o przejrzystość, które Anthropic wpisał w samą nazwę swojego projektu, dotyczy nas wszystkich.

Historia Mythos jest na razie krótka, ledwie dwumiesięczna. A już teraz odsłania napięcie, które naznaczy całą najbliższą dekadę: to samo narzędzie potrafi wzmocnić obrońców, przyspieszyć badania nad lekami i odciążyć inżynierów, a jednocześnie jego twórca uznał je najpierw za zbyt groźne, by trafiło do sprzedaży. Anthropic wpisał w nazwę swojego projektu obietnicę przejrzystości. Najtrudniejszy egzamin z jej dotrzymania przyjdzie dopiero wtedy, gdy modele zaczną projektować swoich następców — a ten moment, jeśli wierzyć liczbom samej firmy, jest bliżej, niż większość z nas zakłada.

Literatura i źródła

Claude Fable 5 and Claude Mythos 5 — Anthropic — oficjalna zapowiedź producenta
Project Glasswing: Securing critical software for the AI era — Anthropic — oficjalny opis inicjatywy
Project Glasswing: An initial update — Anthropic — raport z pierwszych wyników programu
Expanding Project Glasswing — Anthropic — komunikat o rozszerzeniu programu
Greta oto — Wikipedia — artykuł encyklopedyczny o motylu glasswing
Adeno-associated virus — Wikipedia — artykuł encyklopedyczny o wirusach AAV
Anthropic — Wikipedia — artykuł encyklopedyczny o firmie
Anthropic's Claude Fable 5 is a version of Mythos the public can access today — TechCrunch — materiał analityczny o premierze
Anthropic releases Mythos-like AI model to the public, Claude Fable 5 — CNBC — artykuł prasowy
Anthropic brings Mythos to the masses with Claude Fable 5 — VentureBeat — materiał analityczny o cenniku i dostępności
Anthropic releases Claude Fable 5 and Mythos 5 with major gains in coding and science — The Decoder — artykuł z danymi benchmarkowymi
Anthropic Claude Fable 5 on AWS — Amazon Web Services — komunikat techniczny partnera
Anthropic's Claude Mythos Preview Uncovers 10,000+ 0-Days in Project Glasswing — Cybersecurity News — materiał o wynikach skanowania luk
Anthropic shares Mythos with 150 more organizations — Cybersecurity Dive — artykuł o rozszerzeniu dostępu
Anthropic warns AI may soon begin recursive self-improvement — Scientific American — materiał popularnonaukowy o apelu firmy
Anthropic warns AI could soon build itself, urges a global pause — Fortune — artykuł analityczny
Anthropic urges AI labs to pause, warns humans risk losing control — Al Jazeera — artykuł prasowy o kontekście apelu
Anthropic's warning over AI self-improvement has a hidden message — Tom's Hardware — komentarz krytyczny wobec danych firmy

Czym właściwie jest „klasa Mythos"#

Project Glasswing, czyli broń oddana obrońcom#

Fable 5, czyli Mythos dla wszystkich — ale z hamulcem#

Co ten model naprawdę potrafi#

Trzy bariery: cyber, biologia, kopiowanie#

Cisza wokół danych#

Mythos 5 i obietnica leków#

Cień nad premierą#

Co to oznacza dla zwykłego użytkownika#

Literatura i źródła#