Google Wav enet голос не получает правильное произношение слов - Нет, Знай, Снег - PullRequest
1 голос
/ 26 марта 2020

Я пытаюсь синтезировать голос, используя Google WAV enet. В большинстве случаев слова No, Know, Snow при использовании без контекста выходят, оканчиваясь на звук «r». Как Нор, для Нет, Ноуер для ноу-хау, и Снор для снега. Как исправить это произношение?

Пример кода:

    voice[i] = {
      languageCode: 'en-IN',
      name: 'en-IN-Wavenet-B'
    } //ssmlGender: 'INDIAN MALE'

String value = 'Первое слово, начинающееся с S, слева направо - снег. «

1 Ответ

0 голосов
/ 08 апреля 2020

Я воспроизвел ваш случай, используя клиентскую библиотеку python для преобразования текста в речь [1] и скрипт quickstart.py из python -docs-samples [1], используя следующую конфигурацию внутри сценария:

    voice = texttospeech.types.VoiceSelectionParams(
            language_code='en-IN',
            name = 'en-IN-Wavenet-B',
            ssml_gender=texttospeech.enums.SsmlVoiceGender.MALE)

Результат был хорошим, и я не заметил упомянутый вами звук "r". Я также оставляю здесь краткий обзор официальной документации облака Google, которая может помочь вам [3].

Я надеюсь, что это работает сейчас.

[1] https://googleapis.dev/python/texttospeech/latest/index.html

[2] https://github.com/GoogleCloudPlatform/python-docs-samples/tree/master/texttospeech/cloud-client

[3] https://cloud.google.com/text-to-speech/docs/quickstart-client-libraries

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...