DeepSeek V4: 1M tokena konteksta i 1,6 triliona parametara — šta to menja

Poštovani, želim da podelim iz sveta veštačke inteligencije: DeepSeek je predstavio pregled V4 Flash i V4 Pro.
Ukratko:
- Obe su mixture-of-experts sa kontekstnim prozorom do 1M tokena, pogodne za velike baze koda i dokumente.
- V4 Pro — 1,6 triliona parametara (49 milijardi aktivnih). V4 Flash — 284 milijarde parametara (13 milijardi aktivnih).
- Kompanija tvrdi poboljšanja u rezonovanju i zadacima kodiranja, ali modeli zaostaju u znanju (~3–6 meseci).
- Modeli su jeftiniji od konkurenata; istovremeno se pojavljuju optužbe za „destilaciju“ i pitanja IP.
Zašto je to važno: veći kontekst i niža cena ubrzavaju usvajanje LLM, ali pravni i kvalitativni rizici ostaju.
Kako Vi ocenjujete spremnost tržišta da radi sa takvim modelima?
#vestackainteligencija #LLM #masinskoucenje #DeepSeek


Poslednji komentari
Još nema komentara.