Testele arată că ChatGPT-5 are mai puține „halucinații” decât GPT-4, dar nu depășește versiunea 4.5

Când OpenAI a lansat ChatGPT-5 joia trecută, CEO-ul Sam Altman a prezentat noul model drept cel mai „puternic, inteligent, rapid, fiabil și robust” din istoria companiei. Printre îmbunătățirile anunțate se numără și reducerea „halucinațiilor” — erori prin care un model AI inventează informații.

Sub GPT-4.5, dar peste majoritatea concurenței Controverse legate de înlocuirea modelelor vechi

Aceste promisiuni au fost puse la încercare de Vectara, o platformă specializată în analiza ratelor de halucinații ale modelelor lingvistice. Rezultatele arată că ChatGPT-5 are o rată de halucinații de 1,4%, mai mică decât GPT-4 (1,8%) și GPT-4 Turbo/4o mini (1,69%), dar cu doar 0,09% mai bună decât GPT-4o (1,49%).

Sub GPT-4.5, dar peste majoritatea concurenței

Surprinzător, rata de halucinații a ChatGPT-5 este mai mare decât a versiunii GPT-4.5 Preview, care a înregistrat doar 1,2%. Totuși, noul model se situează mult peste media competiției: Gemini-2.5-pro are o rată de 2,6%, iar Grok-4 urcă la 4,8%.

Citeste si

Penuria de memorie RAM amână lansările Mac Studio și MacBook Pro cu ecran tactil

22/04/2026

PGL Bucharest 2027: primul turneu major de Counter-Strike 2 din noul sezon competițional

04/04/2026

Cel mai bun scor din rândul modelelor GPT îi aparține versiunii o3-mini High Reasoning, cu doar 0,795% rată de halucinații. Datele sunt disponibile pe Hughes Hallucination Evaluation Model (HHEM) Leaderboard, găzduit pe Hugging Face.

Controverse legate de înlocuirea modelelor vechi

Lansarea ChatGPT-5 a venit cu o schimbare neașteptată: eliminarea modelelor GPT-4, GPT-4o și 4o-mini din abonamentele Plus. Această decizie a generat…

Citeste continuarea in articolul postat pe IT MANIA

Tags: arată că ChatGPT5 dar decât depășește GPT4 halucinatii mai puține testele versiunea

Testele arată că ChatGPT-5 are mai puține „halucinații” decât GPT-4, dar nu depășește versiunea 4.5

Citeste si

Penuria de memorie RAM amână lansările Mac Studio și MacBook Pro cu ecran tactil

PGL Bucharest 2027: primul turneu major de Counter-Strike 2 din noul sezon competițional

Articole recomandate

Terapia cu fagi, arma împotriva bacteriilor rezistente la antibiotice

Microsoft, dată în judecată pentru oprirea actualizărilor Windows 10

Related Posts

Cum îți extinzi paleta culinară: ghid practic pentru o alimentație mai variată și mai sănătoasă

românii muncesc digital, dar se relaxează analog

Totul e tuberculoză – cartea lui John Green despre boala cu cei mai mulți morți din lume

Samsung extinde programul One UI 8.5 beta la mai multe dispozitive Galaxy

Microsoft, dată în judecată pentru oprirea actualizărilor Windows 10

Ultimele piese redate

WE LOVE MUSIC VIDEOS

Postari recente

Kylie Minogue despre documentarul de pe Netflix: „Nu vreau să fiu definită”

Pepe lansează „Mă mut la mama”, coloana sonoră a comediei cu același nume

INNA x Matoma – „Dream Out Loud”: colaborarea verii pe scena dance internațională

EMAA lansează „Noaptea”, single despre singurătate și emoțiile care se aud cel mai clar după miezul nopții

EMAA lansează „Noaptea”, single despre singurătate și emoțiile care se aud cel mai clar după miezul nopții

Irina Rimes și Delia lansează „Petale”, prima colaborare: piesă despre abuz, bullying și indiferență

Voltaj – Electric

Rares – Ce te-ai face tu

Florian Rus & Inna – 7 zile

VESCAN & Andrei Banuta – Old Friend

Minelli & Busta Rhymes Azucar – Azucar

HUGEL – Jamaican (Bam bam)

Feli – Mânile

Mihail – In felul meu

Trending

Signify și Climate Group îndeamnă guvernele să valorifice „Negawatts” pentru un viitor energetic mai sustenabil

Cine transmite gala în România

Red Dead Redemption ajunge în sfârșit pe PC

Let’s be friends

Despre noi

Contact

Parteneri

Welcome Back!

Retrieve your password