Meta, proprietarul Facebook, a anunțat lansarea unui nou set de modele de inteligență artificială, printre care se numără un evaluator auto-instruit, care ar putea reduce nevoia implicării umane în procesul de dezvoltare a AI.
Anunțul vine după ce Meta a prezentat acest instrument într-un articol publicat în august, explicând modul în care acesta utilizează tehnica „chain of thought”, folosită și de modelele o1 recente ale OpenAI, pentru a emite evaluări de încredere asupra răspunsurilor altor modele.
Această tehnică presupune descompunerea problemelor complexe în pași logici mai mici, ceea ce îmbunătățește acuratețea răspunsurilor la probleme dificile din domenii precum știința, codificarea și matematica. Meta a antrenat modelul de evaluator folosind date generate exclusiv de AI, eliminând complet contribuția umană în acea etapă.
Capacitatea de a utiliza AI pentru a evalua alte AI-uri oferă o perspectivă asupra unui viitor în care agenți autonomi de AI vor putea învăța din propriile greșeli. Mulți cercetători din domeniul AI își imaginează astfel de agenți ca fiind asistenți digitali suficient de inteligenți pentru a efectua o gamă largă de sarcini fără intervenție umană.
Modelele care se auto-perfecționează ar putea elimina nevoia de „Reinforcement Learning from Human Feedback” (Învățare prin consolidare cu feedback uman), un proces adesea costisitor și ineficient care necesită experți umani pentru…

























