26.04.2024
МЫ В СОЦСЕТЯХ:   Страница vashgolos.net в Facebook vashgolos.net в Twitter Страница vashgolos.net в Pinterest
uk en ru

Google добилась прорыва в области синтеза речи с помощью ИИ

В настоящее время довольно просто понять, говорит ли реальный человек, или же речь идёт об искусственном преобразовании текста в речь.

 13.09.2016    
 1990    

Фото: dailytechinfo.org

Фото: dailytechinfo.org

Но может пройти не так много времени, когда робот может заставить поверить в то, что разговор ведётся с настоящим человеком — всё благодаря новому искусственному интеллекту WaveNet, разработанному командой Google DeepMind.

DeepMind ранее уже не раз отличилась в создании успешных алгоритмов нейронных сетей — например, команда создала искусственный интеллект AlphaGo, который оказался весьма хорош при игре в го и обошёл одного из лучших игроков в эту настольную игру.

В настоящее время разработчики используют два основных метода для создания программ генерации человеческой речи. Один подразумевает использование огромной коллекции слов и фрагментов речи, произнесённых одним человеком, из-за чего сложно манипулировать со звуками и интонациями голоса. Другой формирует слова электронно, в зависимости от того, как они должны звучать — интонации здесь задавать проще, но результат звучит гораздо менее естественно.

Чтобы создать синтезатор, звучащий близко к человеческой речи, команда в качестве входящих данных передала нейронной сети аудиозаписи реальных людей. WaveNet обучается соответствию текста определённым формам колебаний волны и затем на основании этой базы знаний формирует из текстовых отрывков отдельные звуковые волны.

Участвовавшие в тестировании люди оценивали новый метод в сравнении с другими алгоритмами на слух. Предпочтение было отдано WaveNet — этот ИИ звучал наиболее «по-человечески» из всех представленных. DeepMind заявляет, что их метод сокращает дистанцию между самыми лучшими синтезаторами и настоящей человеческой речью более чем вдвое. В эксперименте участвовали тексты на английском и китайском. Команда, впрочем, отмечает, что пока WaveNet не может применяться в приложениях, зато можно ознакомиться с образцами синтезированной речи на сайте DeepMind.

Источник: grifonsoft.ru


ЕЩЕ В РАЗДЕЛЕ Технологии

НОВОСТИ С ВИДЕО
ВИДЕО
Astropulse: Reincarnation: Захватывающий научно-фантастический мир (ВИДЕО)
Astropulse: Reincarnation: Захватывающий научно-фантастический мир (ВИДЕО)
19.04.2024   853
ВИДЕО
Alibaba DAMO Academy представила EMO: Система ИИ, оживляющая портреты (ВИДЕО)
Alibaba DAMO Academy представила EMO: Система ИИ, оживляющая портреты (ВИДЕО)
08.03.2024   4170
ВИДЕО
Капсула Varda Space с новейшими лекарствами совершила успешную посадку на Землю
Капсула Varda Space с новейшими лекарствами совершила успешную посадку на Землю
29.02.2024   7964
ВИДЕО
Last Epoch готовится к выходу из раннего доступа: обзор ключевых обновлений версии 1.0
Last Epoch готовится к выходу из раннего доступа: обзор ключевых обновлений версии 1.0
21.02.2024   7106
ВИДЕО
KEK Entertainment готовит зубодробительный танковый шутер «Armor Attack» (ВИДЕО)
KEK Entertainment готовит зубодробительный танковый шутер «Armor Attack» (ВИДЕО)
18.01.2024   6699
ПОПУЛЯРНЫЕ НОВОСТИ

РЕКОМЕНДУЕМ
Сайт может содержать материалы категории 18+    Материалы со знаком   публикуются на правах рекламы.    Размещения рекламы: orderdsffdsg987f@vashgolos.net

При копировании материалов сайта для интернет-изданий обязательна прямая, открытая для поисковых систем гиперссылка.
Администрация сайта не несет ответственности за содержание и достоверность рекламных материалов размещенных на данном сайте, а так же за возможный причененный вред от их использования.

© 2014-2024 "ВАШ ГОЛОС" - vashgolos.net   /   Мнение и взгляды администрации сайта могут не совпадать с мнением или взглядами авторов материала.