Google a făcut disponibilă tehnologia sa de filigranare pentru text generat de inteligență artificială, numită SynthID Text, prin intermediul actualizării Responsible Generative AI Toolkit și prin Hugging Face, un depozit de instrumente AI open source.
Dezvoltatorii pot utiliza acum SynthID Text pentru a determina dacă textul provine din modelele proprii de limbaj de mare capacitate, cu scopul de a facilita dezvoltarea responsabilă a AI, a declarat Pushmeet Kohli, vicepreședinte de cercetare la Google DeepMind.
SynthID detectează textul generat de AI prin observarea unui șir de cuvinte. Modelele de limbaj (LLM) folosesc tokeni pentru a procesa informația și a genera ieșirea. Acești tokeni pot fi un singur caracter, cuvânt sau expresie, iar modelele de limbaj pot prezice care token este cel mai probabil să urmeze altuia, unul câte unul.
Instrumentul va atribui fiecărui token un scor bazat pe probabilitatea apariției sale în ieșirea generată pentru o anumită solicitare. De asemenea, va „încorpora filigrane imperceptibile” direct în text în timpul distribuției tokenilor. Când ieșirea textului este verificată, SynthID compară modelul așteptat de scoruri pentru textul filigranat și cel nefiligranat, determinând dacă un instrument AI a generat textul sau dacă acesta provine dintr-o altă sursă.
Totuși, instrumentul are limitări. Tehnologia necesită cel puțin trei propoziții pentru a funcționa, iar robustetea și acuratețea sa cresc…