Компания DeepSeek планирует представить новую мультимодальную модель искусственного интеллекта — DeepSeek-V4. Согласно информации из надежных источников, релиз модели запланирован на апрель 2026 года.
В течение последних шести месяцев разработкой руководила команда под руководством соучредителя Ляна Вэньфэна. Основное внимание уделялось совершенствованию обработки визуального контента, развитию технологий ИИ-поиска и улучшению качества генерации программного кода. В рамках данного проекта DeepSeek сотрудничала с корпорацией Baidu.
DeepSeek-V4 демонстрирует потенциал контекстного окна до одного миллиона токенов и поддержку мультимодальных данных, включая текст, изображения и видео. Предварительные оценки указывают на наличие десятков триллионов параметров в модели.
Интерес к DeepSeek-V4 значительно возрос после появления на платформе OpenRouter двух новых алгоритмов: Healer Alpha и Hunter Alpha. Healer Alpha предназначен для решения мультимодальных задач и обработки визуальной информации, тогда как Hunter Alpha ориентирован на создание агентных систем и долгосрочное планирование. Однако характеристики данных алгоритмов существенно отличаются от ожидаемых характеристик DeepSeek-V4.
Ключевым направлением развития станет улучшение механизмов долгосрочной памяти. Исследования DeepSeek показывают, что внедрение новых архитектурных решений, таких как «условная память», повысит эффективность работы с большими объемами данных.
Кроме того, DeepSeek-V4 будет оптимизирована для использования с китайскими ИИ-ускорителями, что может сделать её одной из первых крупных моделей, полноценно функционирующих в национальной инфраструктуре Китая.
Апрель 2026 года обещает стать значимым месяцем для китайского рынка искусственного интеллекта. Помимо DeepSeek-V4, ожидается запуск новой модели от Tencent, которая будет обладать примерно 30 миллиардами параметров.