DeepSeek представила модель R1: нового конкурента OpenAI

Китайская компания DeepSeek недавно анонсировала свою новую ИИ-модель открытого типа — DeepSeek-R1. Она соперничает с моделью OpenAI o1 по показателям производительности.

 23.01.2025    
 2461

Китайская компания DeepSeek недавно анонсировала свою новую ИИ-модель открытого типа — DeepSeek-R1, которая уже успела привлечь внимание специалистов в области искусственного интеллекта. По заявлению разработчиков, R1 не только соперничает с моделью OpenAI o1 по показателям производительности, но и предлагает значительные преимущества в плане стоимости и архитектуры.


Превосходство в производительности

DeepSeek-R1 продемонстрировала впечатляющие результаты на ряде сложных бенчмарков. На математическом тесте AIME 2024 модель достигла 79,8% по показателю Pass@1, что немного превысило результат o1 — 79,2%. Особенно выделяется R1 на бенчмарке MATH-500, где она набрала 97,3%, обойдя o1 с его 96,4%. В области программирования R1 набрала 96,3% среди участников на платформе Codeforces, что говорит о высоком уровне её навыков.

Кроме того, модель показала хорошие результаты в общих знаниях: 90,8% на MMLU и 71,5% на GPQA Diamond. Эти достижения подчеркивают универсальность R1 и её сильные способности в области логического вывода.

Технические характеристики

Что касается технических характеристик, DeepSeek-R1 использует архитектуру Mixture-of-Experts (MoE), которая включает в себя 671 миллиард параметров. Однако для каждого прохода активируется только 37 миллиардов параметров, что позволяет эффективно обрабатывать данные без потери производительности. Модель поддерживает контекстное окно длиной до 128K токенов, что делает позволяет ей работать с большими объемами информации.

R1 была обучена на основе масштабирования и использует методы Chain of Thought (CoT) для улучшения своих выводов. Обучение проводилось на примерно 14.8 триллионах токенов с затратами вычислительных ресурсов в 2.664 миллиона GPU-часов.


Сравнение стоимости: R1 против o1

Одним из ключевых преимуществ DeepSeek-R1 является её стоимость. Базовые тарифы на использование R1 в среднем в 27.4 раза ниже по сравнению с o1. Однако реальная экономия становится еще более заметной при учете того, что R1 генерирует примерно в 6.22 раза больше токенов для вывода по сравнению с o1.

Кроме того, благодаря механизму кэширования R1 может снизить затраты на повторяющиеся запросы до 90%. Для кэшированных вводов стоимость составляет всего $0.14 за миллион токенов по сравнению с $7.5 за тот же объем у o1.

Разработка и ограничения

Несмотря на свои достижения, DeepSeek-R1 не лишена недостатков. Модель пока испытывает трудностями при выполнении сложных логических задач и подвержена цензуре в соответствии с требованиями государственных органов Китая. Это означает, что ответы на политически чувствительные вопросы могут быть ограничены при выводе или отредактированы в соответствии с "основными социалистическими ценностями".

Также DeepSeek предлагает более компактные версии своей модели R1 с количеством параметров от 1.5 до 70 миллиардов, которые оптимизированы и даже уже скомпилированы для работы на менее мощных устройствах.


ЕЩЕ В РАЗДЕЛЕ Технологии

НОВОСТИ С ВИДЕО
ВИДЕО
Firefly Video AI от Adobe: Компания врывается в гонку генерации видео
Firefly Video AI от Adobe: Компания врывается в гонку генерации видео
13.02.2025   438
ВИДЕО
Sky Glass Gen 2: новый улучшенный дисплей и Dolby Atmos звук
Sky Glass Gen 2: новый улучшенный дисплей и Dolby Atmos звук
11.02.2025   616
ВИДЕО
VISION GMX32UCDM от GAMEMAX: идеальный выбор не только для геймеров
VISION GMX32UCDM от GAMEMAX: идеальный выбор не только для геймеров
11.02.2025   636
ВИДЕО
Nintendo официально представила свою новую консоль — Nintendo Switch 2
Nintendo официально представила свою новую консоль — Nintendo Switch 2
16.01.2025   3014
ВИДЕО
Nvidia R2X — прототип помощника-аватара для рабочего стола как в фантастических фильмах
Nvidia R2X — прототип помощника-аватара для рабочего стола как в фантастических фильмах
11.01.2025   3037
ПОПУЛЯРНЫЕ НОВОСТИ
Сайт может содержать материалы категории 18+    Материалы со знаком   публикуются на правах рекламы.    Размещения рекламы: vashgolos.netdsffdsg987f@gmail.com

При копировании материалов сайта для интернет-изданий обязательна прямая, открытая для поисковых систем гиперссылка.
Администрация сайта не несет ответственности за содержание и достоверность рекламных материалов размещенных на данном сайте, а так же за возможный причененный вред от их использования.

© 2014-2025 "ВАШ ГОЛОС" - vashgolos.net   /   Мнение и взгляды администрации сайта могут не совпадать с мнением или взглядами авторов материала.