♦ Sistemul reduce erorile factuale cu 33% şi probabilitatea generală a greşelilor cu 18%, comparativ cu GPT 5.2.
OpenAI a lansat la finalul săptămânii trecute GPT-5.4, un nou model promovat ca fiind optimizat pentru mediul de business, descris oficial drept „cel mai eficient model pentru munca profesională”, notează TechCrunch. Noua generaţie vizează eficientizarea fluxurilor de lucru şi este disponibilă în versiunea standard, alături de o variantă axată pe raţionament (GPT-5.4 Thinking) şi una dedicată înaltei performanţe (GPT-5.4 Pro). Versiunea API a modelului suportă ferestre de context masive, de până la un milion de tokenuri. Compania pune accent pe eficienţa consumului de date, modelul rezolvând aceleaşi probleme folosind semnificativ mai puţine tokenuri comparativ cu predecesorul său. O inovaţie tehnică este noul sistem de gestionare a instrumentelor în versiunea API, denumit Tool Search. Anterior, prompturile de sistem trebuiau să definească toate instrumentele disponibile simultan, proces care consuma resurse considerabile pe măsură ce numărul opţiunilor creştea. Noul sistem permite modelului să caute definiţiile doar atunci când este necesar, generând solicitări mai rapide şi mai ieftine pentru infrastructurile complexe.
Acurateţe şi limitarea halucinaţiilor
O componentă centrală a arhitecturii este limitarea halucinaţiilor. Probabilitatea ca noul model să facă erori în afirmaţii individuale a scăzut cu 33% faţă de versiunea 5.2, în timp ce rata generală de eroare a răspunsurilor a fost redusă cu 18%. În plus, a fost integrată o evaluare de siguranţă pentru testarea fluxului de raţionament în cazul sarcinilor cu mai mulţi paşi.
Validarea în piaţă: benchmark-uri record
Sistemul a obţinut rezultate record în testele de utilizare a computerului, precum OSWorld-Verified şi WebArena Verified, dar şi un scor de 83% la testul intern GDPval pentru activităţi cognitive.
Modelul excelează la crearea de documente complexe pe termen lung, precum prezentări, modele financiare şi analize juridice, reuşind să livreze performanţe de top la costuri mai mici şi viteze superioare comparativ cu platformele concurente de pe piaţă, potrivit lui Brendan Foody, CEO al Mercor.