Компания DeepSeek официально выпустила превью — версию своего нового поколения искусственного интеллекта — семейства моделей DeepSeek — V4, доступных с открытыми весами. В рамках этого масштабного релиза пользователям и разработчикам представлены две основные версии: флагманская система V4-Pro и более компактная V4-Flash. Ключевой особенностью анонса стал переход к эпохе экономически эффективной обработки огромных массивов данных, так как теперь стандартное контекстное окно размером в один миллион токенов применяется по умолчанию во всех официальных сервисах компании. Разработчики заявляют, что исходные веса моделей и подробный технический отчет уже размещены в публичном доступе на платформе HuggingFace.
Флагманская модель DeepSeek — V4-Pro построена на архитектуре с общим объемом в 1,6 триллиона параметров, из которых во время активной работы генерации задействуется лишь 49 миллиардов. Согласно техническому отчету, производительность этой версии сопоставима с показателями лучших закрытых коммерческих систем на мировом рынке. В открытом сегменте модель устанавливает новые стандарты: она превосходит все доступные решения в математике, естественных науках и программировании, а также демонстрирует передовые результаты в бенчмарках автономного написания кода. Что касается объема знаний об окружающем мире, создатели отмечают, что V4-Pro уступает только закрытой модели Gemini-3.1 — Pro, уверенно опережая все остальные открытые аналоги.
Для задач, требующих высокой скорости и максимальной экономии ресурсов, компания представила версию DeepSeek — V4-Flash. Архитектура этой модели включает 284 миллиарда общих параметров при 13 миллиардах активных. Несмотря на значительно меньший размер сети, разработчики подчеркивают, что способности V4-Flash к сложному логическому выводу максимально приближены к уровню флагманской версии Pro. В базовых задачах, связанных с работой ИИ-агентов, компактная модель демонстрирует паритет со старшей версией. Главным преимуществом Flash — версии является высокая скорость отклика и крайне выгодная стоимость использования через программный интерфейс.
Достижение миллионного контекста без критической нагрузки на серверную инфраструктуру стало возможным благодаря внедрению глубоких структурных инноваций. Инженеры DeepSeek применили механизм посимвольного сжатия в сочетании с фирменной технологией разреженного внимания DSA. Эти нововведения позволили радикально снизить затраты вычислительных мощностей и оперативной памяти. В результате алгоритмы четвертого поколения способны обрабатывать сверхдлинные контексты с рекордной эффективностью, задавая новые стандарты для открытых языковых моделей.
Особое внимание в новом релизе уделено оптимизации для работы автономных ИИ-агентов и специализированных инструментов разработки. Представители компании сообщили, что семейство DeepSeek — V4 уже имеет бесшовную интеграцию с такими передовыми решениями, как Claude Code, OpenClaw и OpenCode. Более того, новые модели активно применяются внутри самой компании DeepSeek для обеспечения работы собственных систем автономного программирования, что подтверждает их готовность к внедрению в реальные производственные процессы.
Интеграция новинок в существующие проекты продумана с учетом максимального комфорта для специалистов. Обновленный API уже доступен для использования: достаточно сохранить прежний базовый адрес и изменить название модели на deepseek — v4-pro или deepseek — v4-flash. Система полностью поддерживает форматы OpenAI ChatCompletions и Anthropic API. Обе новые версии способны работать в двух режимах — с размышлением и без него. Обычные пользователи могут протестировать алгоритмы в веб-версии чата компании через режимы Expert и Instant.
С переходом на новую архитектуру компания объявила о плановом выводе из эксплуатации предыдущих поколений моделей. Версии deepseek — chat и deepseek — reasoner в настоящее время автоматически перенаправляют запросы на V4-Flash, а после 24 июля 2026 года будут окончательно отключены. На фоне повышенного внимания к релизу руководство призвало общественность доверять информации исключительно из официальных аккаунтов DeepSeek. В заключение разработчики подтвердили свою долгосрочную стратегию, направленную на создание общего искусственного интеллекта.
Источники
Ответы (0)
Пока нет ответов в этой теме.