Google добилась прорыва в области синтеза речи с помощью ИИ

В настоящее время довольно просто понять, говорит ли реальный человек, или же речь идёт об искусственном преобразовании текста в речь.

 13.09.2016    
 2079

Фото: dailytechinfo.org

Фото: dailytechinfo.org

Но может пройти не так много времени, когда робот может заставить поверить в то, что разговор ведётся с настоящим человеком — всё благодаря новому искусственному интеллекту WaveNet, разработанному командой Google DeepMind.

DeepMind ранее уже не раз отличилась в создании успешных алгоритмов нейронных сетей — например, команда создала искусственный интеллект AlphaGo, который оказался весьма хорош при игре в го и обошёл одного из лучших игроков в эту настольную игру.

В настоящее время разработчики используют два основных метода для создания программ генерации человеческой речи. Один подразумевает использование огромной коллекции слов и фрагментов речи, произнесённых одним человеком, из-за чего сложно манипулировать со звуками и интонациями голоса. Другой формирует слова электронно, в зависимости от того, как они должны звучать — интонации здесь задавать проще, но результат звучит гораздо менее естественно.

Чтобы создать синтезатор, звучащий близко к человеческой речи, команда в качестве входящих данных передала нейронной сети аудиозаписи реальных людей. WaveNet обучается соответствию текста определённым формам колебаний волны и затем на основании этой базы знаний формирует из текстовых отрывков отдельные звуковые волны.

Участвовавшие в тестировании люди оценивали новый метод в сравнении с другими алгоритмами на слух. Предпочтение было отдано WaveNet — этот ИИ звучал наиболее «по-человечески» из всех представленных. DeepMind заявляет, что их метод сокращает дистанцию между самыми лучшими синтезаторами и настоящей человеческой речью более чем вдвое. В эксперименте участвовали тексты на английском и китайском. Команда, впрочем, отмечает, что пока WaveNet не может применяться в приложениях, зато можно ознакомиться с образцами синтезированной речи на сайте DeepMind.

Источник: grifonsoft.ru


ЕЩЕ В РАЗДЕЛЕ Технологии

Безкоштовні оголошення України
НОВОСТИ С ВИДЕО
ВИДЕО
Технологии будущего: прозрачный OLED-телевизор от LG уже в продаже по предзаказу
Технологии будущего: прозрачный OLED-телевизор от LG уже в продаже по предзаказу
20.12.2024   543
ВИДЕО
Трейлер «Ведьмак 4» показали на The Game Awards 2024 — начало новой саги (ВИДЕО)
Трейлер «Ведьмак 4» показали на The Game Awards 2024 — начало новой саги (ВИДЕО)
13.12.2024   1043
ВИДЕО
Новая камера от Nokia для промышленности: Обзор 360°, 8K разрешение и поддержка 5G
Новая камера от Nokia для промышленности: Обзор 360°, 8K разрешение и поддержка 5G
11.12.2024   1464
ВИДЕО
Next-SBC: мощный одноплатный ПК с процессором Ryzen 7 7840HS (ВИДЕО)
Next-SBC: мощный одноплатный ПК с процессором Ryzen 7 7840HS (ВИДЕО)
21.11.2024   3307
ВИДЕО
Runway представила Act-One: революцию в анимации с помощью ИИ (ВИДЕО)
Runway представила Act-One: революцию в анимации с помощью ИИ (ВИДЕО)
25.10.2024   6902
ПОПУЛЯРНЫЕ НОВОСТИ
Сайт может содержать материалы категории 18+    Материалы со знаком   публикуются на правах рекламы.    Размещения рекламы: vashgolos.netdsffdsg987f@gmail.com

При копировании материалов сайта для интернет-изданий обязательна прямая, открытая для поисковых систем гиперссылка.
Администрация сайта не несет ответственности за содержание и достоверность рекламных материалов размещенных на данном сайте, а так же за возможный причененный вред от их использования.

© 2014-2024 "ВАШ ГОЛОС" - vashgolos.net   /   Мнение и взгляды администрации сайта могут не совпадать с мнением или взглядами авторов материала.