Google добилась прорыва в области синтеза речи с помощью ИИ

В настоящее время довольно просто понять, говорит ли реальный человек, или же речь идёт об искусственном преобразовании текста в речь.

13.09.2016

Технологии

2079

Но может пройти не так много времени, когда робот может заставить поверить в то, что разговор ведётся с настоящим человеком — всё благодаря новому искусственному интеллекту WaveNet, разработанному командой Google DeepMind.

DeepMind ранее уже не раз отличилась в создании успешных алгоритмов нейронных сетей — например, команда создала искусственный интеллект AlphaGo, который оказался весьма хорош при игре в го и обошёл одного из лучших игроков в эту настольную игру.

В настоящее время разработчики используют два основных метода для создания программ генерации человеческой речи. Один подразумевает использование огромной коллекции слов и фрагментов речи, произнесённых одним человеком, из-за чего сложно манипулировать со звуками и интонациями голоса. Другой формирует слова электронно, в зависимости от того, как они должны звучать — интонации здесь задавать проще, но результат звучит гораздо менее естественно.

Чтобы создать синтезатор, звучащий близко к человеческой речи, команда в качестве входящих данных передала нейронной сети аудиозаписи реальных людей. WaveNet обучается соответствию текста определённым формам колебаний волны и затем на основании этой базы знаний формирует из текстовых отрывков отдельные звуковые волны.

Участвовавшие в тестировании люди оценивали новый метод в сравнении с другими алгоритмами на слух. Предпочтение было отдано WaveNet — этот ИИ звучал наиболее «по-человечески» из всех представленных. DeepMind заявляет, что их метод сокращает дистанцию между самыми лучшими синтезаторами и настоящей человеческой речью более чем вдвое. В эксперименте участвовали тексты на английском и китайском. Команда, впрочем, отмечает, что пока WaveNet не может применяться в приложениях, зато можно ознакомиться с образцами синтезированной речи на сайте DeepMind.

Источник: grifonsoft.ru

ЕЩЕ НОВОСТИ ИЗ РУБРИКИ Технологии:

ЕЩЕ В РАЗДЕЛЕ Технологии

Character AI: когда технологии искуственного интеллекта становятся опасными для детей

ВИДЕО	Технологии будущего: прозрачный OLED-телевизор от LG уже в продаже по предзаказу 20.12.2024 543
ВИДЕО	Трейлер «Ведьмак 4» показали на The Game Awards 2024 — начало новой саги (ВИДЕО) 13.12.2024 1043
ВИДЕО	Новая камера от Nokia для промышленности: Обзор 360°, 8K разрешение и поддержка 5G 11.12.2024 1464
ВИДЕО	Next-SBC: мощный одноплатный ПК с процессором Ryzen 7 7840HS (ВИДЕО) 21.11.2024 3307
ВИДЕО	Runway представила Act-One: революцию в анимации с помощью ИИ (ВИДЕО) 25.10.2024 6902