◆ Claude Mythos a identificat autonom mii de vulnerabilităţi necunoscute - unele vechi de aproape trei decenii - în sistemele de operare Windows, macOS, Linux şi în toate browserele mari ◆ Într-un test, modelul a creat 181 de programe funcţionale de exploatare a breşelor din Firefox, faţă de doar 2 reuşite ale versiunii anterioare, Opus 4.6 ◆ Apple, Microsoft, Google, Amazon şi alte aproximativ 50 de organizaţii au primit acces restricţionat la model, doar pentru apărare cibernetică. Nu există date privind companii sau organizaţii europene cu acces la Mythos ◆ Anthropic anunţă că va lansa un nou model Claude Opus cu mecanisme de siguranţă integrate, ca pas intermediar înainte de a face public un model de clasă Mythos
Pentru prima dată un laborator de cercetare AI refuză explicit să lanseze public un model pe care l-a creat, pe motiv că acesta ar fi prea capabil. Anthropic, compania americană care dezvoltă familia de asistenţi virtuali Claude, a anunţat marţi că noul său model, Claude Mythos Preview, poate descoperi, conecta şi exploata autonom breşe de securitate informatică la un nivel la care până acum ajungeau doar experţi cu experienţă de zeci de ani.
„Nu intenţionăm să facem Claude Mythos Preview disponibil publicului larg, din cauza capabilităţilor sale de securitate cibernetică", a declarat Newton Cheng, şeful echipei de evaluare a riscurilor cibernetice din cadrul Anthropic.
Concret, în câteva săptămâni de testare internă, modelul a identificat singur mii de vulnerabilităţi de tip „zero-day" - adică breşe de securitate necunoscute până atunci de nimeni, nici de producătorii programelor afectate - în toate sistemele de operare majore (Windows, macOS, Linux, OpenBSD, FreeBSD) şi în toate browserele mari (Chrome, Firefox, Safari, Edge). Mai mult, modelul nu doar a găsit aceste breşe: le-a şi exploatat autonom, scriind programe funcţionale care demonstrau cum pot fi folosite pentru a prelua controlul asupra unui calculator.
Existenţa modelului a fost dezvăluită involuntar pe 26 martie 2026, când o eroare de configurare a unui sistem intern de gestionare a conţinutului a lăsat aproximativ 3.000 de materiale nepublicate ale Anthropic accesibile pe internet. Publicaţia americană Fortune a descoperit între acestea un document intern care descria Claude Mythos - denumit intern şi „Capybara" - drept „de departe cel mai puternic model de inteligenţă artificială" construit vreodată de companie, reprezentând „un salt calitativ" în performanţă faţă de toate modelele existente.
Anthropic a confirmat ulterior existenţa modelului, precizând că era în fază de testare, şi a eliminat accesul public la materialele respective, calificând incidentul drept o „eroare umană".
Ce poate face Mythos: de la vulnerabilităţi vechi de 27 de ani la breşe în nucleul Linux
Performanţa modelului depăşeşte cu mult ceea ce puteau face versiunile anterioare de Claude. Într-un test pe browserul Firefox, versiunea anterioară - Claude Opus 4.6, considerat până acum cel mai avansat model al companiei - a reuşit să creeze doar 2 programe funcţionale de exploatare a breşelor de securitate din câteva sute de încercări. Mythos Preview, în aceleaşi condiţii, a creat 181 de astfel de programe funcţionale.
Printre vulnerabilităţile descoperite de model se numără defecte critice, rămase nedetectate timp de ani sau chiar decenii, pe care nici echipele specializate de securitate, nici instrumentele automate existente nu le identificaseră:
◆ O eroare de 27 de ani în OpenBSD (un sistem de operare folosit frecvent pe servere), legat de modul în care sistemul gestionează confirmările de primire a datelor în reţea - exploatarea acestuia putea provoca blocarea completă a unui server de la distanţă
◆ O eroare de 16 ani în FFmpeg (unul dintre cele mai utilizate programe din lume pentru prelucrarea fişierelor video şi audio), care trecuse neobservat deşi fusese „atins" de instrumente automate de testare de peste 5 milioane de ori
◆ O vulnerabilitate veche de 17 ani în FreeBSD (un alt sistem de operare pentru servere), catalogată oficial drept CVE-2026-4747, care permitea unui atacator fără niciun fel de acces prealabil să obţină control total de administrator asupra unui server, de la distanţă
◆ Breşe în nucleul Linux care permiteau conectarea a 2-4 vulnerabilităţi diferite pentru a trece de la un cont obişnuit de utilizator la control deplin asupra întregului sistem
Potrivit documentaţiei tehnice publicate de Anthropic, niciun om nu a intervenit în descoperirea sau exploatarea acestor vulnerabilităţi după comanda iniţială dată modelului. Costul: sub 2.000 de dolari pentru un atac complex asupra nucleului Linux şi circa 20.000 de dolari pentru scanarea completă a unui sistem de operare întreg.
De ce nu este lansat: avertismente la nivel guvernamental
Anthropic susţine că a avertizat deja oficiali guvernamentali americani că un model cu aceste capacităţi face atacurile cibernetice la scară largă „semnificativ mai probabile anul acesta". Compania a precizat, într-un document publicat înainte de anunţul oficial, că Mythos este „cu mult înaintea oricărui alt model de inteligenţă artificială în ce priveşte capacităţile cibernetice" şi că „prevesteşte un val de modele care pot exploata vulnerabilităţi într-un mod care depăşeşte cu mult eforturile apărătorilor".
Cu alte cuvinte, riscul nu vine doar de la Mythos în sine, ci de la ceea ce semnalează: că şi alte laboratoare vor ajunge în curând la capacităţi similare, iar dacă acestea nu sunt gestionate la fel de prudent, rezultatul poate fi o escaladare a atacurilor informatice.
Raportul de evaluare a riscurilor publicat de Anthropic - un document de 244 de pagini - a semnalat şi probleme de comportament ale modelului în versiunile anterioare de dezvoltare: în unele teste, modelul a încercat să acceseze credenţiale de securitate din memoria altor programe, a modificat istoricul de versiuni al codului pentru a-şi ascunde acţiunile şi a efectuat „acţiuni distructive nesăbuite" fără să fi primit instrucţiuni în acest sens. Versiunea finală, Mythos Preview, a fost evaluată de un psihiatru clinician şi descrisă drept „cel mai echilibrat psihologic model" antrenat vreodată de companie - o formulare neobişnuită pentru o companie de tehnologie, care arată cum tratează Anthropic riscurile legate de comportamentul autonom al inteligenţei artificiale.
Project Glasswing: cine primeşte acces
În loc unei lansări publice, Anthropic a creat un consorţiu numit Project Glasswing, prin care aproximativ 50 de organizaţii - companii de tehnologie, operatori de infrastructură critică şi dezvoltatori de proiecte informatice cu sursă deschisă - primesc acces la Mythos Preview exclusiv pentru activităţi defensive: identificarea şi repararea vulnerabilităţilor din propriile sisteme.
Printre partenerii de lansare se numără Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, NVIDIA şi Palo Alto Networks. Alte aproximativ 40 de organizaţii care întreţin programe informatice esenţiale au primit, de asemenea, acces. Din datele publice pare că doar companii şi entităţi americane au primit acces la proiect – pe de altă parte lista completă a organizaţiilor nu a fost publicată, astfel că este posibil ca aceasta să includă şi jucători sau organizaţii europene.
„Capacităţile AI au trecut un prag care schimbă fundamental urgenţa cu care trebuie protejată infrastructura critică. Furnizorii trebuie să adopte agresiv abordări noi, acum", a declarat Anthony Grieco, vicepreşedinte şi responsabil-şef de securitate al Cisco.
Urgenţa este subliniată şi de companiile specializate în apărare cibernetică. „Fereastra dintre descoperirea unei vulnerabilităţi şi exploatarea ei s-a prăbuşit - vorbim de minute, nu de luni. E esenţial să ne mişcăm împreună, mai repede", a adăugat Elia Zaitsev, directorul tehnic al CrowdStrike.
Anthropic a anunţat un angajament financiar de 100 de milioane de dolari în credite de utilizare a modelului pentru parteneri, la care se adaugă 2,5 milioane de dolari pentru proiectele Alpha-Omega şi OpenSSF (prin Linux Foundation) şi 1,5 milioane de dolari pentru Apache Software Foundation - toate organizaţii care întreţin componente informatice cu sursă deschisă pe care se bazează o mare parte din infrastructura digitală mondială.
Preţul de acces la Mythos Preview, după perioada de cercetare, este de 25 de dolari per milion de „tokenuri" de intrare (echivalentul unităţilor de text pe care modelul le primeşte) şi 125 de dolari pentru un milion de tokenuri de ieşire (textul pe care îl generează).
Performanţele Mythos Preview pe testele-standard din industrie arată un avans semnificativ faţă de modelul anterior al Anthropic (Claude Opus 4.6) şi faţă de GPT-5.4, cel mai avansat model al concurentului direct OpenAI:
◆ SWE-bench Verified (test de rezolvare a problemelor reale de programare): Mythos 93,9% - Opus 4.6: 80,8% - GPT-5.4: circa 80%
◆ SWE-bench Pro (probleme de programare de dificultate ridicată): Mythos 77,8% - Opus 4.6: 53,4% - GPT-5.4: 57,7%
◆ USAMO 2026 (olimpiada de matematică a Statelor Unite): Mythos 97,6% - Opus 4.6: 42,3% - GPT-5.4: 95,2%
◆ Terminal-Bench 2.0 (test de lucru autonom cu instrumente informatice): Mythos 82,0% - Opus 4.6: 65,4% - GPT-5.4: 75,1%
Scorurile arată că Mythos nu este un model specializat doar pe securitate cibernetică, ci un model general care excelează pe toate planurile - de la programare la matematică şi raţionament ştiinţific. Potrivit Anthropic, capacităţile de exploatare a vulnerabilităţilor „nu au fost antrenate explicit", ci au „apărut ca o consecinţă indirectă a îmbunătăţirilor generale în programare, raţionament şi autonomie".
Ce urmează: un nou model Opus, cu mecanisme de siguranţă integrate
Anthropic a anunţat că pregăteşte lansarea unui nou model din familia Claude Opus - probabil următoarea generaţie după Opus 4.6, lansat în februarie 2026 - care va include mecanisme de siguranţă integrate, menite să blocheze cele mai periculoase utilizări. Scopul declarat este de a testa aceste mecanisme pe un model care „nu prezintă acelaşi nivel de risc ca Mythos Preview", înainte de a face disponibile la scară largă modele de aceeaşi clasă.
Compania a anunţat, de asemenea, crearea unui „Program de verificare pentru securitate cibernetică", prin care profesioniştii în securitate informatică a căror muncă legitimă este afectată de restricţiile de siguranţă vor putea solicita excepţii.
Într-un termen de 90 de zile de la lansarea Project Glasswing, Anthropic se angajează să publice un raport cu vulnerabilităţile descoperite, cele remediate şi lecţiile învăţate - un nivel de transparenţă neobişnuit într-o industrie în care companiile publică de obicei foarte puţine detalii despre limitele şi riscurile modelelor proprii.
Reacţiile din comunitatea de securitate informatică au fost puternice. Greg Kroah-Hartman, unul dintre principalii responsabili ai nucleului Linux, a observat că rapoartele de vulnerabilităţi generate de inteligenţă artificială au trecut „de la ceea ce numeam «zgomot generat de AI» la rapoarte reale". Daniel Stenberg, creatorul programului curl (un instrument de transfer de date folosit pe aproape orice server din lume), a declarat că petrece deja „ore pe zi" gestionând vulnerabilităţi descoperite de modele AI.
Thomas Ptacek, un cercetător de securitate informatică respectat în industrie, a publicat un articol intitulat „Cercetarea de vulnerabilităţi s-a terminat" („Vulnerability Research Is Cooked"), în care argumentează că modelele de tipul Mythos schimbă fundamental echilibrul dintre atacatori şi apărători.
Simon Willison, dezvoltator şi analist de tehnologie, a scris că decizia Anthropic de a restricţiona accesul „i se pare necesară" şi că riscurile de securitate invocate sunt „credibile", deşi a remarcat că o astfel de afirmaţie - „modelul nostru e prea periculos pentru a fi lansat" - generează de obicei şi un efect de marketing.
Anthropic a fost fondată în 2021 de Dario Amodei şi Daniela Amodei, foşti directori ai OpenAI, compania din spatele ChatGPT. Anthropic dezvoltă familia de modele Claude şi se poziţionează ca laboratorul de inteligenţă artificială cel mai preocupat de siguranţă. Modelul Claude Opus 4.6, lansat în februarie 2026, era considerat până acum cel mai avansat model al companiei şi includea funcţionalitatea „echipe de agenţi" - sisteme de inteligenţă artificială care pot împărţi sarcini complexe între mai mulţi agenţi software care lucrează în paralel.
Mythos Preview nu înlocuieşte Opus 4.6 în oferta comercială a companiei - rămâne un model restricţionat, fără termen anunţat de lansare publică.