Чат-бот китайской компании DeepSeek предлагает поиск данных в Сети без специальной подписки и доступен для российских пользователей. В конце января приложение с нейросетью стало самым скачиваемым на iPhone
В ноябре 2024 года китайская компания DeepSeek открыла доступ к большой языковой модели DeepSeek V3. Разработчики утверждают, что чат-бот на базе модели способен конкурировать с ChatGPT, а основатели компании и вовсе нацелились на создание «сверхразумного» ИИ. Рассказываем, что представляет собой модель, какие она предлагает опции и как с ней работать.
Содержание:
- Что это
- Возможности
- Как пользоваться
- Примеры использования
Что такое DeepSeek V3
DeepSeek V3— это большая языковая модель с открытым исходным кодом, которая после содержит 671 млрд параметров и обучена на 14,8 трлн токенов. Она способна анализировать тексты, делать переводы и писать эссе, а также создавать код.
Особенности модели кроются в ее архитектуре и методах обучения. Она использует:
- Архитектуру Multi-token Prediction (MTP). Это позволяет модели предсказывать несколько слов вместо одного, анализируя одновременно разные части предложения. Такой метод повышает точность работы модели и ее производительность;
- Mixture of Experts (MoE). Эта архитектура использует несколько специализированных и заранее обученных нейросетей-«экспертов» для анализа различных входных данных. Это позволяет ускорить обучение и повысить эффективность ИИ. DeepSeek V3 работает с 256 такими нейросетями, из которых восемь активируются для обработки каждого токена;
- Технологию Multi-head Latent Attention (MLA)— механизм внимания, который обычно используется в больших языковых моделях и помогает им идентифицировать наиболее важные части предложения. MLA позволяет извлекать ключевые детали из фрагмента текста несколько раз, а не только один. Это означает, что ИИ с меньшей вероятностью упустит важную информацию.
Благодаря этим особенностям модель потребовала всего 2,788 млн часов или два месяца работы графических процессоров Nvidia H800 для обучения. Затраты на него составили $5,5 млн. Для сравнения— OpenAI потратила на обучение GPT $78 млн.
Индустрия 4.0 Что такое ChatGPT и на что он способен: от кода до стихов и диалогов
Разработчики утверждают, что в тестах нейросеть превзошла GPT-4о от OpenAI, Llama 3 от Meta (признана экстремистской, запрещена в России) и Claude 3.5 Sonnet от Anthropic в задачах программирования и обработки текста.
Результаты тестов DeepSeek V3 и конкурентов (Фото: github.com)
Главная особенность новой модели— это полностью открытый код, который позволяет разработчикам не только использовать технологию для коммерческих целей, но и адаптировать ее для решения различных задач в сфере искусственного интеллекта.
В марте 2025 годаDeepSeek представила улучшенную версию модели DeepSeek-V3,получившуюназвание V3-0324. Она значительно улучшила показатели, особенно в математических задачахи написаниикода.
Экономика инноваций 7 нейросетей для написания текстов: от поста до сценария
Возможности DeepSeek V3
Модель предлагает контекстное окно в 128 тыс. токенов, как и GPT-4o, что позволяет ей анализировать до 300 страниц текста. Она способна:
- генерировать тексты разных объемов и в разных жанрах;
- искать информацию в интернете;
- расшифровывать диаграммы и объяснять картинки;
- писать код, корректно форматировать его и решать сложные задачи по программированию на языках C++, Go, Java, JavaScript, Python и Rust. Модель успешно интегрируется с редакторами кода;
- рассуждать подобно GPT-o1 и o1-mini в режиме DeepThink.
DeepSeek V3 предлагает мультиязычность высокого уровня, а ее глубокое понимание китайского и английского позволяет работать с текстами без потери качества переводенного текстаи смысла. Модель также поддерживает русский язык.
Минус нейросети в том, что пока она не позволяет анализировать материалы по ссылкам, а поддерживает только загрузки или выдержки из текстов.
Как пользоваться DeepSeek V3 в России
DeepSeek предлагает несколько вариантов доступа, в том числе через открытые модели на Hugging Face, бесплатную версию на собственном сайте с контекстным окном до 32 тыс. токенов, API для коммерческого использования, локальное развертывание и мобильные приложения для iOS и Android. При выходе DeepSeek-R1 пользователям было доступно 50 бесплатных запросов в день,сейчас ограничения на сайте не указаны.
Как воспользоваться бесплатной версией на сайте
Пользователи в России могут получить доступ к DeepSeek V3 через сайт. Для этого нужно:
- перейти на сайт DeepSeek, нажать Start Now;
- пройти регистрацию (можно с помощью аккаунта Google);
- откроется диалоговое окно с чат-ботом. В нем, помимо обычного ответа, можно выбрать опцию DeepThink для рассуждений или Search для поиска данных в Интернете. Также для анализа можно прикрепить до 50 файлов разного формата размером до 100МБ каждый.
Как воспользоваться мобильным приложением
В декабре 2024 года DeepSeek выпустила бесплатное мобильное приложение для своего чат-бота. Оно доступно в российских магазинах App Store и Google Play. Также приложение можно скачать с сайта разработчиков, выбрав Get DeepSeek App и просканировав QR-код.
После установки и открытия приложения нужно нажать Agree, чтобы согласиться с условиями его использования, пройти регистрацию, после чего появится диалоговое окно с чат-ботом.
Интерфейс мобильного приложения DeepSeek (Фото: deepseek.com)
Примеры использования DeepSeek
Протестируем возможности модели в задаче генерации текста— попросим ее написать статью о трендах развития нейросетей в 2025 году. Чат-бот выдал структурированный материал на 4,5 тыс. знаков.
Статья про нейросети от DeepSeek V3 (Фото: deepseek.com)
А теперь попросим нейросеть подобрать специализированные англоязычные источники для этого материала. DeepSeek V3 предложила выборку из 41 ресурса, в том числе сайтов научных работ arXiv, IEEEXplore и Nature со ссылками и пояснениями.
Выборка сайтов от DeepSeek V3 (Фото: deepseek.com)
Предложим чат-боту порассуждать— отправим ему рассказ «Лигейя» Эдгара Аллана По и попросим объяснить, в чем смысл предисловия.
DeepSeek V3 объясняет суть предисловия к рассказу в режиме DeepThink (Фото: deepseek.com)
Вернемся к актуальным событиям и попросим чат-бота подготовить подборку десяти ресурсов с афишами культурных мероприятий Москвы. Нейросеть подготовила выборку не только российских, но и англоязычных сайтов.
Выборка афиш от DeepSeek V3 (Фото: deepseek.com)
А теперь попросим чат-бота отобрать самые интересные театральные премьеры зимнего сезона.
Подборка театральных премьер от DeepSeek V3 (Фото: deepseek.com)
Испытаем возможности DeepSeek V3 в анализе больших текстов. Попросим ИИ кратко пересказать сюжет «Маленького принца» Антуана де Сент-Экзюпери объемом 112 страниц. DeepSeek V3 в ответ не только передает сюжет, но и представляет главных героев, описывает основные темы рассказа и кратко резюмирует его.
Анализ «Маленького принца» от DeepSeek V3 (Фото: deepseek.com)
Напоследок попросим нейросеть решить задачу по программированию, написав алгоритм для поиска минимального числа линий, которые необходимы для построения диаграммы. В ответ DeepSeek V3 не только выдает искомый алгоритм на языке Python, но и объясняет ход решения задачи, а также возможные сложности.
Индустрия 4.0 Что такое промт, для чего он нужен и как правильно его написать
Краткие тезисы
- DeepSeek V3 — новый мощный ИИ с открытым исходным кодом, претендующий на лидерство.
- Рекордные параметры: 671 млрд параметров и обучение на 14,8 трлн токенов.
- Уникальная архитектура: сочетает несколько инновационных технологий обработки.
- Экономичное обучение: всего $5,5 млн против $78 млн у GPT-4.
- Огромное контекстное окно: до 300 страниц текста за один запрос.
- Мультиязычный ассистент с особым акцентом на китайский и английский.
- Бесплатный доступ через сайт, API и мобильные приложения.
- Широкий функционал: от текстов до программирования.
- Работа с файлами:поддержка загрузки документов.
- Текущие ограничения: нет анализа по внешним ссылкам.
➤ Подписывайтесь на телеграм-канал «РБК Трендов»— будьте в курсе последних тенденций в науке, бизнесе, обществе и технологиях.