Этот инструмент, по сути, способен воспроизводить речь любого человека на основе всего лишь 15-секундного аудиообразца голоса.
Компания OpenAI внедрила новый инструмент под названием Voice Engine, предназначенный для клонирования голоса. Этот инструмент, по сути, способен воспроизводить речь любого человека на основе всего лишь 15-секундного аудиообразца. Сообщает
GagadgetРазработка Voice Engine началась в компании OpenAI еще в 2022 году на основе уже существующего API преобразования текста в речь. К настоящему моменту OpenAI активно использует версии этого инструмента для работы с предустановленными голосами.
Предполагаемые области применения этой технологии включают чтение вслух, автоматический перевод языков и помощь людям с нарушениями речи. Например, OpenAI упомянула о пилотном проекте в Университете Брауна, где был создан клон голосового движка на основе заранее записанного аудио для пациента с речевыми расстройствами.
Однако, помимо потенциальных преимуществ, существуют опасения относительно возможного злоупотребления этой технологией для создания фальшивого аудиоконтента. В связи с этим OpenAI пока не готова к полномасштабному публичному выпуску Voice Engine и активно работает над решением проблем конфиденциальности и безопасности.
Как обеспечивается безопасность?
Компания принимает во внимание отзывы партнеров из различных сфер, таких как правительство, СМИ и гражданское общество, чтобы гарантировать безопасный запуск продукта. В рамках предварительного тестирования все участники должны соблюдать политику использования, которая запрещает выдачу себя за другого человека без его согласия.
Кроме того, OpenAI принимает ряд мер безопасности, таких как нанесение водяных знаков для отслеживания происхождения аудио, проактивный мониторинг использования системы и создание "списка запрещенных голосов" для предотвращения клонирования голосов известных личностей.
Цена и ожидания
Точные сроки официального выпуска и окончательные цены пока не объявлены. Однако, согласно данным TechCrunch, предполагается, что Voice Engine будет стоить около $15 за миллион символов, что делает его более доступным по сравнению с аналогичными продуктами на рынке. Кроме того, упоминается возможная версия "HD" с более высокой ценой.