Суббота, 22 апреля 2023 23:57

Скрипт для преобразования текста в аудио. Google Cloud Text-to-Speech API

Оцените материал
(17 голосов)

Продолжение старой разработки, см. ссылки в левом сайдбаре.

 

Скрипт для преобразования текста в аудио. Google Cloud Text-to-Speech API.
Скрипт для преобразования текста в аудио. Google Cloud Text-to-Speech API.

Приложение поддерживает теперь тридцать языков, для них доступны все декларированные (на момент публикации материала) документацией Google Cloud Text-to-Speech API звуковые движки: наряду с WaveNet и Basic вы можете работать с Neural2 и Studio. Использование интерактивной командной строки tty-promt включает проверку ввода данных, делая работу с программой удобной и комфортной.

 

Dev banner 1

 

Neural2 - голосовой движок премиум-класса, основанный на той же технологии, что используется и для создания пользовательского голоса. Neural2 представляет собой последнее слово в области создания синтетического голоса и позволяет любому использовать технологию Custom Voice без обучения. Голосовые движки Neural2 доступны в глобальных и однорегиональных конечных точках.

Также Google Cloud Text-to-Speech API представляет Studio. Этот тип голосовых движков разработан специально для использования с длинными текстами: повествование, чтение новостей и т.д. Голоса Studio в настоящее время (на момент публикации статьи) не поддерживают SSML.

 

Скрипт для преобразования текста в аудио. Google Cloud Text-to-Speech API
Скрипт для преобразования текста в аудио. Google Cloud Text-to-Speech API

 

Напоминаю, запрос к Google Cloud Text-to-Speech API не может превышать 5000 байт, конвертировать в звук возможно как текст, так и SSML, API предоставляет отличные бесплатные квоты, но требует наличия ключа, для получения которого необходима привязка банковской карты.

 

Увидеть на гитхабе.

 

В любой момент вы можете клонировать / скачать Google-Cloud-Text-To-Speech-Ruby-CLI-App из репозитория GitHub.

Последнее изменениеВоскресенье, 23 апреля 2023 00:46

Оставить комментарий

Добавьте ваш комментарий

Text To Speech

Tic-Tac-Toe with a Neural Network

Комментарии в блоге