Hugging Face представила SmolVLA: компактную модель для робототехники

Hugging Face выпустила SmolVLA — компактную модель ИИ для робототехники, работающую даже на MacBook. Это упростит создание сложных роботизированных систем.

05.06.2025    
 969
Автор: Silas Pierce

Платформа для разработки искусственного интеллекта Hugging Face сделала значительный шаг в робототехнике, выпустив новую модель SmolVLA. Этот компактный open-source проект обещает упростить создание сложных роботизированных систем даже на бюджетном оборудовании.

Hugging Face представила SmolVLA: компактную модель для робототехники

Hugging Face представила SmolVLA: компактную модель для робототехники

Что такое SmolVLA?

SmolVLA — это модель vision-language-action (VLA), объединяющая обработку визуальных данных, понимание языка и управление действиями робота в одном компактном решении. Состоящая всего из 450 миллионов параметров, она значительно меньше традиционных VLA-моделей, которые часто насчитывают миллиарды параметров. Несмотря на скромный размер, SmolVLA демонстрирует впечатляющую производительность, превосходя более крупные аналоги в симуляциях и реальных задачах.

Технические особенности модели

Модель разработана для работы на доступном оборудовании, таком как потребительские GPU или даже MacBook. Это стало возможным благодаря оптимизациям, включая обрезку слоёв, предсказание действий по частям и асинхронный стек вывода. Асинхронный подход отделяет обработку визуальных и звуковых данных от управления действиями, что ускоряет реакцию робота на 30% и удваивает пропускную способность задач.

Характеристика Описание
Размер модели 450 миллионов параметров
Оборудование Потребительский GPU, MacBook
Производительность 87.3% в LIBERO, 78.3% в реальных задачах
Особенности Асинхронный вывод, обучение на одном GPU

Данные и обучение

SmolVLA обучена на 23 тысячах эпизодов из 481 набора данных LeRobot Community Datasets, собранных сообществом. Эти данные включают разнообразные сценарии — от лабораторных до бытовых условий, что делает модель устойчивой к реальным условиям, таким как переменное освещение или нестандартные объекты. Обучение проводилось на одном GPU, что снижает барьеры для исследователей и энтузиастов.

Выпуск SmolVLA — часть стратегии Hugging Face по демократизации робототехники. Модель поддерживает недорогие платформы, включая роботизированные системы компании, такие как SO100 и SO101. Недавнее приобретение Pollen Robotics и выпуск доступных роботов, таких как HopeJR и Reachy Mini, подтверждают амбиции компании. SmolVLA уже протестирована на стороннем роботизированном манипуляторе, показав отличные результаты с минимальной настройкой.

Конкуренция и перспективы

Hugging Face не одинока в стремлении к open-source робототехнике. NVIDIA, K-Scale Labs и Physical Intelligence также развивают открытые решения. Однако компактность и эффективность SmolVLA выделяют её на фоне конкурентов. В будущем компания планирует расширять наборы данных и масштабировать модель, сохраняя низкую вычислительную нагрузку.

SmolVLA открывает новые возможности для разработчиков и исследователей, делая робототехнику доступной для широкой аудитории. Это не просто технологический прорыв, но и шаг к созданию открытой экосистемы, где каждый может внести вклад в развитие умных машин.



ЕЩЕ В РАЗДЕЛЕ Технологии

НОВОСТИ С ВИДЕО
ВИДЕО
The Expanse: Osiris Reborn — анонсирован новый sci-fi экшен-RPG
The Expanse: Osiris Reborn — анонсирован новый sci-fi экшен-RPG
10.06.2025   706
ВИДЕО
Vivo T4 Ultra: анонсирован мощный конкурент флагманов
Vivo T4 Ultra: анонсирован мощный конкурент флагманов
09.06.2025   779
ВИДЕО
Chrono Odyssey: бета-тест новой MMORPG стартует в июне 2025
Chrono Odyssey: бета-тест новой MMORPG стартует в июне 2025
08.06.2025   862
ВИДЕО
Resident Evil Requiem выйдет в 2026 году: подробности анонса
Resident Evil Requiem выйдет в 2026 году: подробности анонса
08.06.2025   858
ВИДЕО
Stellar Blade бьёт рекорды популярности перед релизом в Steam
Stellar Blade бьёт рекорды популярности перед релизом в Steam
03.06.2025   1102
ПОПУЛЯРНЫЕ НОВОСТИ