DeepSeek je predstavio besplatni, open-source veliki jezički model krajem decembra, za čiji razvoj je bilo potrebno manje od 6 miliona dolara i samo dva mjeseca rada, a korišteni su procesori smanjenih mogućnosti kompanije Nvidia pod nazivom H800.
Ovakav razvoj događaja je "aktivirao alarm" i pokrenuo pitanje da li se američko globalno vodstvo na polju umjetne inteligencije smanjuje, a dovedeno je u pitanje i ogromno ulaganje u AI modele i podatkovne centre.
U nizu benchmark testova treće strane, DeepSeekov model se pokazao boljim nego Metin Llama 3.1, OpenAI-jev GPT-4o i Anthropicov Claude Sonnet 3.5 kada je riječ o preciznosti u raznim zadacima, od složenog rješavanja problema do matematike i kodiranja.
DeepSeek je prije nekoliko dana lansirao r1, model koji je nadmašio OpenAI-jev najnoviji o1 u mnogim od pomenutih testova treće strane.
"DeepSeekov model je impresivan. Kineski razvoj moramo shvatiti veoma, veoma ozbiljno", izjavio direktor Microsofta Satya Nadella.
Kinezi su se morali nositi sa strogim ograničenjima za poluvodiče, koje je vlada SAD-a nametnula njihovoj zemlji, čime joj je onemogućila pristup najmoćnijim čipovima kao što je Nvidijin H100. Najnoviji napredak sugeriše da DeepSeek ili pronalazi način da zaobilazi pravila ili da kontrola izvoza nije onakva kakvu je Washington namjeravao uspostaviti.
"Oni mogu uzeti veoma dobar veliki model te koristiti proces nazvan destilacija. U osnovi koriste veoma veliki model kako bi pomogli malom modelu da postane 'pametniji' u stvarima u kojim žele da to bude. To je zapravo veoma efikasan način kada je riječ o troškovima", rekao je generalni partner Benchmarka Chetan Puttagunta.
O kompaniji i njenom osnivaču Liangu WenFengu se malo zna. Kompanija je nastala iz kineskog funda High-Flyer Quant, koja upravlja imovinom vrijednom oko 8 milijardi dolara.
No, DeepSeek nije jedina kineska kompanija koja se probija na tržištu.
Vodeći AI istraživač Kai-Fu Lee je rekao da je njegov startup 01.ai obučen koristeći tri miliona dolara. ByteDance, matična kompanija društvene mreže TikTok, objavila je nadogradnju svog modela tvrdeći da nadmašuje OpenAI-jev 01 u ključnom benchmark testu.
"Potreba je majka izuma. Oni su morali smisliti rješenje, a zapravo su na kraju napravili nešto mnogo efikasnije", kazao je direktor Perplexityja Aravind Srinivas.