Timp de aproape cinci ani, industria inteligenței artificiale a fost dominată de o singură obsesie: antrenarea modelelor de limbaj de mari dimensiuni.
Procesul este costisitor, consumă cantități uriașe de energie și se desfășoară în centre de date gigantice, unde mii de cipuri specializate rulează neîntrerupt, săptămâni sau luni întregi, asimilând miliarde de informații — de la definiții de cuvinte și fapte istorice până la statistici financiare și imagini. Acum, însă, centrul de greutate al sectorului se mută vizibil spre un alt tip de procesare: inferența.
Inferența este ceea ce se întâmplă după antrenare — momentul în care un model AI deja pregătit răspunde efectiv la întrebările utilizatorilor. Dacă antrenarea poate fi comparată cu formarea unui chef care învață sute de rețete și tehnici, inferența reprezintă operațiunea zilnică a restaurantului: clienții plasează comenzi, iar bucătarul le pregătește. Această distincție, aparent tehnică, are acum implicații majore pentru întreaga industrie.
Potrivit firmei de cercetare Gartner, cheltuielile globale pentru servicii cloud de înaltă performanță dedicate inferenței AI vor depăși pentru prima dată, în acest an, cheltuielile similare destinate antrenării modelelor. Până în 2029, companiile vor cheltui aproape dublu pe infrastructura de inferență față de cea de antrenare — 72 de miliarde de dolari, comparativ cu 37 de miliarde.
Această schimbare…


























