Новая модель DeepSeek R1: открытый ИИ доступен под лицензией MIT
Китайский стартап DeepSeek представил R1 — модель ИИ с 685 млрд параметров, конкурирующую с OpenAI o1 и Claude 3.5 Sonnet.
Китайская компания DeepSeek представила обновлённую версию своей модели искусственного интеллекта DeepSeek R1, которая обещает стать серьёзным конкурентом мировым лидерам, таким как OpenAI и Anthropic. Модель, доступная на платформе Hugging Face под лицензией MIT, открывает новые горизонты для коммерческого использования ИИ благодаря своей производительности и экономичности.
Новая модель DeepSeek R1: открытый ИИ доступен под лицензией MIT
Технические характеристики R1
DeepSeek R1 обладает архитектурой с 685 миллиардами параметров, что делает её одной из крупнейших моделей ИИ. Используя подход Mixture of Experts (MoE), она активирует только 37 миллиардов параметров для обработки каждого токена, что снижает вычислительные затраты. Модель демонстрирует выдающиеся результаты в задачах, связанных с математикой, программированием и логическим мышлением, сопоставимые с OpenAI o1 и Claude 3.5 Sonnet.
DeepSeek удалось создать R1, используя менее мощные чипы NVIDIA H800 и A100, несмотря на экспортные ограничения США. Благодаря оптимизации, включая многоуровневую латентную внимательность (MLA) и эффективное распределение вычислений, обучение модели обошлось всего в $5.6 млн, что в разы дешевле аналогов. Это позволило снизить стоимость использования API до 95% по сравнению с OpenAI o1.
Влияние на рынок
Запуск R1 вызвал настоящий ажиотаж. Приложение DeepSeek AI Assistant обошло ChatGPT в рейтинге App Store, а модель на Hugging Face породила более 500 производных версий с 2.5 млн загрузок. Однако успех DeepSeek вызвал обеспокоенность в США, где акции NVIDIA упали на $600 млрд из-за опасений, что китайские компании могут подорвать доминирование американских ИИ-гигантов.
Открытая лицензия MIT делает R1 привлекательной для разработчиков и бизнеса. DeepSeek также выпустил шесть "дистиллированных" версий модели с 1.5 до 70 млрд параметров, которые могут работать даже на ноутбуках. Проект Open-R1 от Hugging Face стремится воссоздать процесс обучения R1, чтобы сделать технологию ещё доступнее. Однако некоторые эксперты, включая Винода Хослу, предполагают, что DeepSeek мог использовать данные OpenAI, что вызывает вопросы об этике разработки.
DeepSeek R1 — это не просто технологический прорыв, но и вызов существующему порядку в индустрии ИИ. Сочетание производительности, экономичности и открытости делает модель потенциальным катализатором для демократизации ИИ, хотя геополитические риски и вопросы этики остаются на повестке дня.