Question

Я только начал играть с Google Text-To-Speech API.Я сгенерировал почтовый запрос по адресу:

https://texttospeech.googleapis.com/v1/text:synthesize?fields=audioContent&key={YOUR_API_KEY}

со следующими данными:

{
 "input": {
  "text": "Hola esto es una prueba"
},
 "voice": {
  "languageCode": "es-419"
 },
 "audioConfig": {
  "audioEncoding": "LINEAR16",
  "speakingRate": 1,
  "pitch": 0
 }
}

и получил ответ 200 с содержанием:

{
    "audioContent" : "UklGRn6iCwBXQVZFZm10I...(super long string)"
}

Я предполагаю, что это закодировано (или декодировано, не уверен насчет имен), но я бы хотел услышать, что на самом деле означает «audioContent».

Simon Ernesto Cardenas Zarate · Answer 1 · 24 февраля 2019

Как указал Tanaike , ответ действительно Base64.Чтобы фактически прослушать звук, я вставил закодированную строку base64 в файл, затем запустил:

base64 -d audio.txt > audio.wav

, и это сделало трюк.

как преобразовать линейный16 текст в речь в аудио файл

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

как преобразовать линейный16 текст в речь в аудио файл

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы