Новая модель DeepSeek R1: открытый ИИ доступен под лицензией MIT

Китайский стартап DeepSeek представил R1 — модель ИИ с 685 млрд параметров, конкурирующую с OpenAI o1 и Claude 3.5 Sonnet.

29.05.2025    
 157
Автор: Silas Pierce

Китайская компания DeepSeek представила обновлённую версию своей модели искусственного интеллекта DeepSeek R1, которая обещает стать серьёзным конкурентом мировым лидерам, таким как OpenAI и Anthropic. Модель, доступная на платформе Hugging Face под лицензией MIT, открывает новые горизонты для коммерческого использования ИИ благодаря своей производительности и экономичности.

Новая модель DeepSeek R1: открытый ИИ доступен под лицензией MIT

Новая модель DeepSeek R1: открытый ИИ доступен под лицензией MIT

Технические характеристики R1

DeepSeek R1 обладает архитектурой с 685 миллиардами параметров, что делает её одной из крупнейших моделей ИИ. Используя подход Mixture of Experts (MoE), она активирует только 37 миллиардов параметров для обработки каждого токена, что снижает вычислительные затраты. Модель демонстрирует выдающиеся результаты в задачах, связанных с математикой, программированием и логическим мышлением, сопоставимые с OpenAI o1 и Claude 3.5 Sonnet.

DeepSeek удалось создать R1, используя менее мощные чипы NVIDIA H800 и A100, несмотря на экспортные ограничения США. Благодаря оптимизации, включая многоуровневую латентную внимательность (MLA) и эффективное распределение вычислений, обучение модели обошлось всего в $5.6 млн, что в разы дешевле аналогов. Это позволило снизить стоимость использования API до 95% по сравнению с OpenAI o1.

Влияние на рынок

Запуск R1 вызвал настоящий ажиотаж. Приложение DeepSeek AI Assistant обошло ChatGPT в рейтинге App Store, а модель на Hugging Face породила более 500 производных версий с 2.5 млн загрузок. Однако успех DeepSeek вызвал обеспокоенность в США, где акции NVIDIA упали на $600 млрд из-за опасений, что китайские компании могут подорвать доминирование американских ИИ-гигантов.

Открытая лицензия MIT делает R1 привлекательной для разработчиков и бизнеса. DeepSeek также выпустил шесть "дистиллированных" версий модели с 1.5 до 70 млрд параметров, которые могут работать даже на ноутбуках. Проект Open-R1 от Hugging Face стремится воссоздать процесс обучения R1, чтобы сделать технологию ещё доступнее. Однако некоторые эксперты, включая Винода Хослу, предполагают, что DeepSeek мог использовать данные OpenAI, что вызывает вопросы об этике разработки.

DeepSeek R1 — это не просто технологический прорыв, но и вызов существующему порядку в индустрии ИИ. Сочетание производительности, экономичности и открытости делает модель потенциальным катализатором для демократизации ИИ, хотя геополитические риски и вопросы этики остаются на повестке дня.



ЕЩЕ В РАЗДЕЛЕ Технологии

НОВОСТИ С ВИДЕО
ВИДЕО
Google Android XR: умные очки с Gemini AI представлены официально
Google Android XR: умные очки с Gemini AI представлены официально
27.05.2025   276
ВИДЕО
Новинки Acer на Computex 2025: Predator с RTX 50 и 500 Гц мониторы
Новинки Acer на Computex 2025: Predator с RTX 50 и 500 Гц мониторы
18.05.2025   979
ВИДЕО
Galaxy S25 Edge — тонкий ответ Samsung на будущий iPhone Air (VIDEO)
Galaxy S25 Edge — тонкий ответ Samsung на будущий iPhone Air (VIDEO)
13.05.2025   1371
ВИДЕО
Роботизированный «мотоконь» Corleo: новинка от Kawasaki (ВИДЕО)
Роботизированный «мотоконь» Corleo: новинка от Kawasaki (ВИДЕО)
07.04.2025   4399
ВИДЕО
Quake II созданый ИИ: Microsoft экспериментирует с Muse
Quake II созданый ИИ: Microsoft экспериментирует с Muse
07.04.2025   4275
ПОПУЛЯРНЫЕ НОВОСТИ