Zabranjeni čipovi, skriveni planovi i AI budućnost: Šta Kina ne govori o DeepSeek-u?
Kineski tehnološki inovator DeepSeek predstavio je novu verziju svog veštačko-inteligentnog modela, V3.1. Prema saopštenju kompanije, ovaj model donosi ozbiljna poboljšanja u brzini obrade i sposobnosti prilagođavanja korisniku, ostavljajući iza sebe prethodnu verziju R1 0528.
Posebno se ističe prošireni kontekstualni prozor koji sada iznosi 128.000 tokena, dovoljno da model „pamti“ sadržaj čitave knjige od oko 300 strana. To otvara vrata naprednijoj komunikaciji sa korisnicima jer AI sada može bolje da razume duže tokove konverzacije i kompleksne zadatke.
Veštačka inteligencija koja "pamti" kao roman
Veliki kontekstualni kapacitet DeepSeek V3.1 znači da sistem može da zadrži i obradi znatno više informacija iz prethodnih interakcija. Time se postiže realističniji i smisleniji dijalog u više koraka, što je ključno za korisnike koji rade sa obimnim tekstovima ili složenim analizama.
Ova funkcionalnost sve je važnija u trci sa globalnim AI rivalima jer se korisnici sve više oslanjaju na asistente za zadatke kao što su pisanje izveštaja, pravna analiza, kodiranje i istraživanje. DeepSeek V3.1 želi da ponudi upravo tu dubinu.
Tiha eliminacija R1 i pitanja o R2
Međutim, lansiranje V3.1 zasenilo je odsustvo bilo kakvih novih informacija o modelu R2, koji se dugo najavljivao kao sledeći veliki korak. U međuvremenu, pažljivim korisnicima nije promaklo da je iz AI četa uklonjena referenca na prethodni model R1 iz funkcije „duboko razmišljanje“.
To je izazvalo sumnje da se nešto dešava iza pozadine. Da li je R2 odložen? Da li postoje tehnički problemi koji usporavaju razvoj? Kompanija se do sada nije oglašavala tim povodom, ostavljajući prostor za nagađanja.
Problemi sa Huawei čipovima
Prema informacijama do kojih je došao Financial Times, razvoj modela R2 suočen je sa izazovima zbog ograničenja hardvera. Konkretno, DeepSeek je planirao da koristi Huawei Ascend čipove i za obuku i za izvođenje AI operacija, ali je došlo do tehničkih problema u tom procesu.
Zbog toga je kompanija navodno prešla na Nvidia čipove za obuku modela, dok su Huawei čipovi ostali u upotrebi za fazu inferencije, deo gde model „izvodi zaključke“, ali koja je znatno manje zahtevna od treniranja. Ta promena strategije očigledno je pomerila rokove.
Bez zvaničnog datuma za R2
R2 je prvobitno trebalo da bude lansiran u maju, ali taj datum je prošao bez ikakvog saopštenja. S obzirom na tišinu iz DeepSeek-a, kao i sve izraženiju konkurenciju iz SAD-a i drugih delova Azije, neizvesnost oko izlaska R2 modela postaje sve veći teret.
U međuvremenu, DeepSeek pokušava da održi tempo kroz unapređene verzije postojećih modela. V3.1 je snažan korak napred, ali bez jasnog plana za R2, kompanija rizikuje da izgubi deo zamaha koji je godinama gradila.
Zabranjeno preuzimanje dela ili čitavog teksta i/ili foto/videa, bez navođenja i linkovanja izvora i autora, a u skladu sa odredbama WMG uslova korišćenja i Zakonom o javnom informisanju i medijima.