DeepSeek анонсировала модель V4 с контекстом до миллиона токенов

Компания DeepSeek готовит релиз модели DeepSeek...

freepik.com

MaxДзенTelegram

DeepSeek-V4: новая ИИ-модель с контекстом до 1 млн токенов и мультимодальностью

Компания DeepSeek готовится к выпуску новой мультимодальной модели искусственного интеллекта DeepSeek-V4, релиз которой ожидается в апреле 2026 года. Разработка велась последние полгода под руководством сооснователя Лян Вэньфэна.

Особенности модели

DeepSeek-V4 получит контекстное окно до 1 млн токенов и будет работать с текстом, изображениями и видео. В модели предполагается десятки триллионов параметров, улучшенная генерация кода и поддержка мультимодального контента.

Долгосрочная память и архитектура

Одним из ключевых направлений является улучшение долгосрочной памяти. Новые архитектурные решения, включая «условную память», позволят эффективно обрабатывать большие объёмы данных, повышая производительность ИИ при длительных задачах.

Оптимизация и инфраструктура

DeepSeek-V4 будет оптимизирована для китайских ИИ-ускорителей и может стать одной из первых крупных моделей, полностью работающих в национальной вычислительной инфраструктуре Китая. Это позволит ускорить работу с мультимодальными задачами на локальной платформе.

Конкуренция и рынок

Интерес к модели усилился после появления алгоритмов Healer Alpha и Hunter Alpha на платформе OpenRouter. Помимо DeepSeek-V4, в апреле ожидается запуск модели Tencent с примерно 30 млрд параметров, что сделает месяц насыщенным для китайского ИИ-рынка, сообщает the-geek.ru.

Больше новостей и эксклюзивных видео смотрите в канале Самара Онлайн 24 в MAX.

Читайте также:

MaxДзенTelegramВКонтактеОдноклассники