DeepSeek V4: 1M токенов контекста и 1.6 трлн параметров — что это меняет

Друзья, хочу поделиться из мира ИИ: DeepSeek показала превью V4 Flash и V4 Pro.
Коротко:
- Обе — mixture-of-experts с окном до 1 млн токенов, пригодны для больших кодовых баз и документов.
- V4 Pro — 1.6 трлн параметров (49 млрд активных). V4 Flash — 284 млрд (13 млрд активных).
- Компания заявляет улучшения в рассуждении и задачах кодинга, но модели отстают в знаниях (~3–6 месяцев).
- Модели дешевле конкурентов; одновременно возникают обвинения в «дистилляции» и вопросы IP.
Почему это важно: больше контекста и низкая цена ускоряют внедрение LLM, но юридические и качественные риски остаются.
Как Вы оцениваете готовность рынка работать с такими моделями?
#ИИ #LLM #машиннообучение #DeepSeek


Последние комментарии
Комментариев пока нет.