Mistral запускает Voxtral: открытый аудио-ИИ для бизнеса
Французская компания Mistral представила Voxtral — открытую аудио-ИИ-платформу для бизнеса с поддержкой мультиязычной транскрипции и анализа по цене от $0.001 за минуту.
Французский стартап Mistral, известный своими разработками в области искусственного интеллекта, сделал шаг в аудиотехнологии, выпустив Voxtral — первую линейку открытых аудио-ИИ-моделей. Анонсированная 15 июля 2025 года платформа ориентирована на бизнес и предлагает доступную альтернативу закрытым системам от таких гигантов, как OpenAI и Google. Voxtral обещает высокую точность транскрипции и семантического анализа аудио при стоимости, которая, по заявлению компании, в два раза ниже конкурентов.
Mistral запускает Voxtral: открытый аудио-ИИ для бизнеса
Что такое Voxtral?
Voxtral — это семейство моделей ИИ, способных обрабатывать аудио продолжительностью до 30 минут для транскрипции и до 40 минут для понимания контекста. Платформа построена на базе языковой модели Mistral Small 3.1 и поддерживает функции, такие как ответы на вопросы по аудиоконтенту, генерация кратких текстовых сводок и выполнение голосовых команд через API. Модели доступны в двух вариантах: Voxtral Small (24 млрд параметров) для крупных проектов и Voxtral Mini (3 млрд параметров) для локальных и периферийных устройств.
Модель | Параметры | Назначение | Стоимость API |
---|---|---|---|
Voxtral Small | 24 млрд | Масштабные проекты | От $0.001/мин |
Voxtral Mini | 3 млрд | Локальные устройства | От $0.001/мин |
Voxtral Mini Transcribe | 3 млрд | Только транскрипция | Менее $0.001/мин |
Преимущества и возможности
Voxtral выделяется на фоне конкурентов благодаря открытости и мультиязычности. Платформа поддерживает английский, испанский, французский, португальский, хинди, немецкий, голландский, итальянский и другие языки с автоматическим определением. Среди ключевых функций:
- Транскрипция аудио до 30 минут с контекстом до 32 тыс. токенов.
- Генерация текстовых сводок и ответов на вопросы по аудио.
- Запуск API и выполнение функций через голосовые команды.
- Возможность локального развертывания для повышения безопасности данных.
По данным Mistral, Voxtral Small превосходит Whisper large-v3 от OpenAI по точности и конкурирует с GPT-4o-mini и Gemini 2.5 Flash, обеспечивая меньшую частоту ошибок при транскрипции.
Конкуренция и перспективы
Mistral позиционирует Voxtral как решение для компаний, которые ищут баланс между ценой и качеством. Платформа доступна бесплатно через Hugging Face или чат-бот Le Chat, а интеграция через API начинается от $0.001 за минуту.
Это значительно дешевле, чем Whisper ($0.006/мин) или GPT-4o-mini ($0.003/мин). Компания также предлагает корпоративные решения, включая настройку под специфические отрасли, такие как медицина или юриспруденция, и планирует добавить функции распознавания спикеров и анализа эмоций.
Запуск Voxtral следует за релизом Magistral — моделей для логического анализа, что укрепляет позиции Mistral как лидера европейского ИИ. Компания активно привлекает инвестиции, включая переговоры о $1 млрд от фонда MGX из Абу Dhabi.
Voxtral от Mistral — это амбициозный шаг в сторону демократизации аудио-ИИ. Открытый код, низкая стоимость и высокая производительность делают платформу привлекательной для бизнеса, стремящегося к гибким и экономичным решениям. В условиях растущей конкуренции в области ИИ Mistral продолжает-REDACTED может стать серьезным игроком, бросающим вызов технологическим гигантам.