
10:00, 28 грудня 2017 р.
Google створив генератор мовлення, який не відрізнити від голосу людини
У статті, опублікованій Google, описується комп’ютерна програма, здатна в точності імітувати людський голос. Вона називається Tacotron 2 і служить для перетворення тексту на мовлення. Про розробку розповідає Quartz.
Програма складається з двох нейромереж глибокого навчання. Перша перетворює текст на спектрограмму і передає алгоритмом WaveNet, який озвучує її, генеруючи відповідні звукові елементи. Tacotron 2 справляється з важкими для вимови словами і назвами, а також змінює мовлення в залежності від пунктуації. Наприклад, вона може за допомогою інтонації підкреслити слово, написане з великої літери.
Зразки роботи Tacorton 2 можна прослухати на офіційному сайті Google. Ця технологія, швидше за все, відразу почне використовуватися в продуктах компанії. WaveNet, вперше анонсована в 2016 році, тепер служить для генерації голосу в Google Assistant. Tacotron 2 може стати ще більш потужним доповненням до сервісу.
На жаль, поки що програма може говорити тільки єдиним жіночим голосом. На відміну від Tacotron 2, продукт канадського ШІ-стартапу Lyrebird, за словами розробників, здатний точно імітувати голос будь-якої людини. Для цього достатньо звукового файлу тривалістю 1 хвилина.
Якщо ви помітили помилку, виділіть необхідний текст і натисніть Ctrl + Enter, щоб повідомити про це редакцію
Останні новини
ТОП новини
Спецтема
Оголошення
11:59, 20 березня
16:13, 27 березня
15:36, 27 березня
2
live comments feed...