◆ Anthropic a redus „nivelul de efort" al modelului Claude de la „ridicat" la „mediu" fără să anunţe utilizatorii - o schimbare care face modelul mai rapid şi mai ieftin de operat, dar mai imprecis pe sarcini complexe ◆ Stella Laurenzo, director senior de inteligenţă artificială la AMD, a publicat în nume propriu o analiză bazată pe 6.852 de sesiuni Claude Code ale echipei sale şi a concluzionat că modelul citeşte codul de trei ori mai rar înainte de a-l modifica şi abandonează sarcini la un ritm care anterior era zero ◆ Anthropic neagă că ar degrada intenţionat modelele, dar nu răspunde la întrebări specifice ale presei despre capacitatea de calcul
Anthropic, compania americană de inteligenţă artificială fondată în 2021 de foşti directori ai OpenAI şi evaluată în februarie 2026 la 380 de miliarde de dolari, se confruntă cu o revoltă a utilizatorilor săi cei mai activi. Nemulţumirile au izbucnit după ce compania a redus fără anunţ public nivelul implicit de „efort" al modelului Claude - în esenţă, cât de mult gândeşte modelul înainte de a răspunde - de la „ridicat" la „mediu". Schimbarea face modelul mai rapid şi mai ieftin de operat, dar, susţin dezvoltatorii, semnificativ mai imprecis pe sarcini complexe.
„Claude a regresat în punctul în care nu mai poate fi de încredere pentru sarcini complexe de inginerie", a scris Stella Laurenzo, director senior de inteligenţă artificială la AMD, într-o analiză publicată pe platforma GitHub pe 2 aprilie 2026. Analiza nu este un raport oficial AMD - Laurenzo a publicat-o în nume propriu - dar se bazează pe datele echipei sale de inginerie de la AMD şi greutatea concluziilor vine tocmai din poziţia pe care o ocupă şi din volumul de date pe care le prezintă.
Ce arată datele: o scădere măsurabilă
Analiza lui Laurenzo se bazează pe 6.852 de sesiuni Claude Code - instrumentul de programare al Anthropic, lansat la începutul lui 2025, care funcţionează ca un agent autonom capabil să citească, scrie şi execute cod în mediul de lucru al dezvoltatorului. Datele acoperă 234.760 de apeluri de instrumente şi 17.871 de blocuri de gândire, măsurate pe parcursul a mai multor luni.
Concluziile: modelul citeşte codul de trei ori mai rar înainte de a-l modifica (frecvenţa de citire a scăzut de la 6,6 la 2 operaţii pe sarcină), rescrie fişiere întregi de două ori mai des, iar rata de abandonare a sarcinilor - care anterior era zero - a urcat la 10 cazuri pe zi în a doua jumătate a lunii martie.
„Când gândirea este superficială, modelul alege implicit acţiunea cea mai ieftină: editează fără să citească, se opreşte fără să termine, evită responsabilitatea", a scris Laurenzo. Ea a adăugat că echipa sa a trecut la un furnizor concurent care „realizează o muncă de calitate superioară", fără a oferi detalii din cauza unor acorduri de confidenţialitate. Formularea ei - „am trecut" - sugerează că decizia a fost luată la nivelul echipei sau al diviziei sale de inteligenţă artificială din cadrul AMD, dar nu este clar dacă reprezintă o migrare la nivel de companie.
Laurenzo nu este singura voce critică. „Am avut sesiuni incredibil de frustrante cu Claude Code în ultimele două săptămâni", a scris pe platforma X Dimitris Papailiopoulos, cercetător principal la Microsoft. „Am setat efortul la maxim, dar modelul rămâne extrem de neglijent, ignoră instrucţiunile şi repetă aceleaşi greşeli."
Ce spune Anthropic: efortul redus, nu capacitatea
Boris Cherny, directorul produsului Claude Code la Anthropic, a răspuns plângerilor online spunând că compania a redus nivelul implicit de efort la „mediu" la începutul lunii martie, ca răspuns la feedback-ul utilizatorilor care reclamau că modelul consuma prea mulţi „tokeni" - unităţile de date pe care le procesează modelul - pentru fiecare sarcină. Cu cât mai mulţi tokeni per sarcină, cu atât mai multă putere de calcul consumată.
Cherny a contestat concluzia centrală a analizei lui Laurenzo. El a explicat că o modificare din februarie 2026 care ascunde „urmele de gândire" ale modelului din interfaţă este doar o schimbare vizuală care „nu afectează gândirea în sine, bugetele de gândire sau modul în care funcţionează raţionamentul extins". Separat, el a menţionat că modelul Opus 4.6 a introdus pe 9 februarie o funcţie de „gândire adaptivă" care îi permite modelului să decidă singur cât de profund raţionează.
Pentru a rezolva unele dintre probleme, Cherny a anunţat că Anthropic va testa trecerea utilizatorilor din planurile Teams şi Enterprise la nivelul ridicat de efort în mod implicit, „chiar dacă asta vine cu un cost suplimentar de tokeni şi latenţă".
Cherny a respins şi acuzaţiile de lipsă de transparenţă, susţinând că schimbarea nivelului de efort a fost semnalată utilizatorilor prin intermediul unui mesaj pop-up în interfaţa Claude Code.
Anthropic a refuzat însă să răspundă la întrebările specifice ale publicaţiei Fortune privind plângerile utilizatorilor.
Un contraargument vine din testele independente: firma de evaluare Margin Lab, care rulează benchmarkul SWE-Bench-Pro - un test standardizat de performanţă pentru instrumente de programare -, raportează că modelul Opus 4.6 a arătat „variaţii, dar fără schimbare de substanţă" de la introducerea sa. Cu alte cuvinte, pe teste controlate, modelul nu pare degradat - ceea ce sugerează că diferenţa dintre experienţa utilizatorilor şi benchmark-uri poate ţine de tipul de sarcini: cele repetitive şi controlate versus cele complexe, cu mai mulţi paşi, unde efortul de gândire contează mai mult.
Contextul face criza mai acută. Anthropic a anunţat săptămâna recent că veniturile sale anuale recurente au ajuns la 30 de miliarde de dolari - în creştere de la 9 miliarde la finalul lui 2025 şi de la un miliard de dolari cu doar 14 luni în urmă. Compania beneficiază de o avalanşă de noi utilizatori, întâi datorită popularităţii Claude Code în rândul programatorilor, apoi datorită unui val de simpatie publică generat de un conflict cu Departamentul american al Apărării .
Această creştere pune presiune pe infrastructura de calcul. Anthropic a suferit o serie de căderi recente - inclusiv una pe 13 aprilie care a afectat atât claude.ai, cât şi Claude Code timp de circa 50 de minute - şi a introdus limite de utilizare mai stricte în orele de vârf. Disponibilitatea API-ului Anthropic a fost de 98,95%, sub standardul de industrie de 99,99%.
Într-un memo intern raportat de CNBC, directorul de venituri al OpenAI - competitorul direct al Anthropic - a susţinut că Anthropic a făcut o „eroare strategică" prin faptul că nu a asigurat suficientă capacitate de calcul şi că „operează pe o curbă semnificativ mai mică" decât concurenţa. Anthropic nu a comentat nici aceste afirmaţii.
Diferenţa de infrastructură este cuantificabilă. Potrivit estimărilor din industrie, Anthropic a încheiat anul 2025 cu aproximativ 1,4 GW de capacitate de calcul, comparativ cu 1,9 GW pentru OpenAI. Proiecţiile pentru 2026 amplifică decalajul: Anthropic vizează 7-8 GW, în timp ce OpenAI ar urma să ajungă în de “zeci” de GW, potrivit declaraţiilor proprii.
Situaţia este agravată de anunţul Anthropic din săptămâna trecută privind Mythos - un nou model, încă nelansat public, prezentat ca semnificativ mai capabil decât actualul Opus, dar şi mai mare şi mai costisitor de operat. Anthropic invocă motive de securitate pentru amânarea lansării, dar unii analişti pun sub semnul întrebării dacă compania are capacitatea de calcul necesară pentru a susţine o distribuţie largă.
Reuters a raportat, separat, că Anthropic analizează posibilitatea de a-şi proiecta propriile cipuri de calcul - un semn că presiunea pe infrastructură nu este doar o percepţie a utilizatorilor.
Criza de performanţă vine la un moment critic. Anthropic - fondată de Dario şi Daniela Amodei, foşti directori OpenAI - s-a diferenţiat de la începuturi prin promisiunea de transparenţă şi de aliniere la interesele utilizatorilor. Acuzaţia recurentă din partea comunităţii de dezvoltatori nu este doar că modelul s-a degradat, ci că
Anthropic nu a fost sinceră în legătură cu motivele.
„Reclamaţiile că Anthropic nu a fost sinceră în privinţa schimbărilor pe care le-a făcut modului în care Claude operează sunt deosebit de ameninţătoare pentru companie, tocmai pentru că, mai mult decât orice altă firmă de inteligenţă artificială, a încercat să-şi construiască reputaţia pe faptul că este mai transparentă şi mai aliniată la interesele utilizatorilor", notează Fortune.
Compania pregăteşte, potrivit mai multor surse, o listare pe bursa Nasdaq în octombrie 2026, cu Goldman Sachs şi JPMorgan ca bănci coordonatoare, la o evaluare ţintă de 400-500 de miliarde de dolari şi o emisiune de peste 60 de miliarde.
Pe lângă problemele de performanţă ale modelelor, utilizatorii Cowork - interfaţa desktop a lui Claude, aflată în stadiu de previzualizare - raportează pe GitHub probleme separate de afişare: mesajele lui Claude dispar din chat dacă utilizatorul navighează în altă parte în timpul generării răspunsului, iar istoricul conversaţiilor apare trunchiat sau corupt. Sunt probleme de interfaţă, nu de model, dar contribuie la percepţia generală de instabilitate.