Când OpenAI a lansat ChatGPT-5 joia trecută, CEO-ul Sam Altman a prezentat noul model drept cel mai „puternic, inteligent, rapid, fiabil și robust” din istoria companiei. Printre îmbunătățirile anunțate se numără și reducerea „halucinațiilor” — erori prin care un model AI inventează informații.
Aceste promisiuni au fost puse la încercare de Vectara, o platformă specializată în analiza ratelor de halucinații ale modelelor lingvistice. Rezultatele arată că ChatGPT-5 are o rată de halucinații de 1,4%, mai mică decât GPT-4 (1,8%) și GPT-4 Turbo/4o mini (1,69%), dar cu doar 0,09% mai bună decât GPT-4o (1,49%).
Sub GPT-4.5, dar peste majoritatea concurenței
Surprinzător, rata de halucinații a ChatGPT-5 este mai mare decât a versiunii GPT-4.5 Preview, care a înregistrat doar 1,2%. Totuși, noul model se situează mult peste media competiției: Gemini-2.5-pro are o rată de 2,6%, iar Grok-4 urcă la 4,8%.
Cel mai bun scor din rândul modelelor GPT îi aparține versiunii o3-mini High Reasoning, cu doar 0,795% rată de halucinații. Datele sunt disponibile pe Hughes Hallucination Evaluation Model (HHEM) Leaderboard, găzduit pe Hugging Face.
Controverse legate de înlocuirea modelelor vechi
Lansarea ChatGPT-5 a venit cu o schimbare neașteptată: eliminarea modelelor GPT-4, GPT-4o și 4o-mini din abonamentele Plus. Această decizie a generat…


























