Cercetătorii din domeniul inteligenței artificiale de la Stanford și Universitatea din Washington au reușit să antreneze un model de „raționament” al inteligenței artificiale pentru mai puțin de 50 de dolari, în credite de calcul în cloud, conform unei noi lucrări de cercetare publicate vinerea trecută, scrie Tech Crunch.
Modelul, cunoscut sub numele de s1, are rezultate similare cu cele ale modelelor de raționament de ultimă generație, cum ar fi o1 de la OpenAI și R1 de la DeepSeek, la testele care măsoară abilitățile matematice și de codare.
Modelul s1 este disponibil pe GitHub, împreună cu datele și codul utilizate pentru formarea sa.
Echipa din spatele s1 a declarat că a început cu un model de bază disponibil pe piață, apoi l-a perfecționat prin distilare, un proces de extragere a capacităților de „raționament” dintr-un alt model de inteligență artificială prin antrenarea pe răspunsurile acestuia.
Modelul, distilat din unul dintre modelele de raționament ale Google
Cercetătorii au declarat că s1 este distilat din unul dintre modelele de raționament ale Google, Gemini 2.0 Flash Thinking Experimental.
Distilarea este aceeași abordare pe care cercetătorii de la Berkeley au folosit-o pentru a crea un model de raționament AI pentru aproximativ 450 de dolari luna trecută.
Pentru unii, ideea că câțiva cercetători fără milioane de dolari în spate pot totuși inova în domeniul inteligenței artificiale este interesantă. Dar s1 ridică întrebări reale cu privire la comoditizarea modelelor AI.
Deloc surprinzător, marile laboratoare de IA nu sunt mulțumite. OpenAI a acuzat DeepSeek că a colectat în mod necorespunzător date din API-ul său în scopul distilării modelelor.
Cercetătorii din spatele s1 au căutat să găsească cea mai simplă abordare pentru a obține performanțe puternice de raționament și „scalarea timpului de testare”, sau pentru a permite unui model AI să gândească mai mult înainte de a răspunde la o întrebare.
Acestea au fost câteva dintre descoperirile din o1 al OpenAI, pe care DeepSeek și alte laboratoare de AI au încercat să le reproducă prin diverse tehnici.
Ce este DeepSeek și de ce a zguduit piețele bursiere din întreaga lume?
Această inteligență artificială utilizează cipuri mai puțin puternice, sfidând modelul de afaceri al unor giganți precum Nvidia, care depinde, printre alți factori, de vânzarea de tehnologii avansate de inteligență artificială, potrivit El Pais.
Consecințele: Nvidia, cea mai valoroasă companie din lume în funcție de valoarea de piață, de aproape 3,5 trilioane de dolari, și-a văzut acțiunile scăzând cu peste 15% la jumătatea ședinței, sau mai mult de 500 de miliarde de dolari evaporați într-o singură zi.
De ce este important acest lucru? Este cea mai mare pierdere de valoare a unei acțiuni din istoria pieței bursiere, iar pedeapsa a relegat Nvidia pe locul al treilea, după Apple și Microsoft.
De ce afectează piețele? Pentru că este o demonstrație că industria poate dezvolta inteligență artificială eficientă fără a avea nevoie de cipurile scumpe ale Nvidia, ceea ce îi slăbește poziția dominantă.
Și are legătură și cu geopolitica: blocarea de către SUA a cipurilor avansate a forțat China să dezvolte alternative, precum DeepSeek, într-un timp record și la costuri reduse.