У меня есть небольшой технический вопрос об арендной плате за службу TTS в IBM Watson: Контекст. В рамках нашего клиентского проекта может показаться, что интеграция TTS из IBM Watson (базирующейся во Франкфурте) в приложение на французском языке с Голос «ReneeV3» (самый продвинутый по-французски) кажется довольно медленным (текст или SSML), когда мы запрашиваем получение TTS в формате MP3 (самый легкий формат). У вас есть идеи, где эта задержка TTS для отправки нам текста в звуковом формате MP3? Вот демонстрация TTS (чтобы попробовать с голосом ReneeV3): https://text-to-speech-demo.ng.bluemix.net/
Я тестирую длинный текст (2/3 предложения), и это делает 5-10 секунд.
В Curl запрос в IBM TTS занимает 14 секунд:
% Всего% полученных%% Xferd Средняя скорость Время Время Время Текущая загрузка Загрузка Всего отработанных левых скоростей 100 243k 0 242k 100 566 16718 38 0 : 00: 14 0:00:14 -: -: - 18155 поиск: 0,129299 подключение: 0,256685 подключение: 0,897460 предварительный перевод: 0,897710 перенаправление: 0,000000 начальный перевод: 1,537781 всего: 14,857815