Обнаружение фонем IBM в Python - PullRequest
       11

Обнаружение фонем IBM в Python

0 голосов
/ 08 февраля 2019

Я пытаюсь использовать библиотеку *1002* * Python to Text * * * для разработчика с помощью , чтобы определить, какие фонемы или слоги существуют в каком-либо тексте.Но я сталкиваюсь с некоторыми проблемами, связанными с обязательным параметром, называемым customization_id, и я надеюсь, что кто-то сможет предоставить больше контекста о том, какое значение передать. Я не смог понять после прочтения документов.Вот фрагмент кода:

from watson_developer_cloud import TextToSpeechV1, WatsonApiException

API_KEY = "<redacted>"
URL = "https://gateway-wdc.watsonplatform.net/text-to-speech/api"

client = TextToSpeechV1(iam_apikey=API_KEY, url=URL)

try:
    #response = client.get_word(customization_id="1", word="HELLO WORLD") 
    #> Malformed GUID: '1'

    #response = client.get_word(word="HELLO WORLD") 
    #> get_word() missing 1 required positional argument: 'customization_id'

    #response = client.get_word(customization_id=None, word="HELLO WORLD") 
    #> ValueError: customization_id must be provided

    #response = client.get_word(customization_id="GA", word="HELLO WORLD") 
    #> ERROR 400: Malformed GUID: 'GA'

    # WHAT VALUE TO USE FOR CUSTOMIZATION_ID ??? ...
    response = client.get_word(customization_id="_______", word="HELLO WORLD") #>

    print("RESPONSE")
    print(type(response))
except WatsonApiException as ex:
    print(f"ERROR {str(ex.code)}: {ex.message}")

РЕДАКТИРОВАТЬ: Возможно, ожидаемое значение является идентификатором новой пользовательской модели голоса.Я начал исследовать эту стратегию здесь , но, к сожалению, у меня тоже возникают проблемы с этой стратегией.Подход может быть что-то вроде:

# ...

voice_model_response = client.create_voice_model(
    name="My Custom Model",
    language=LANG,
    description="to get a valid 'customization_id' value..."
).get_result()

customization_id = voice_model_response["customization_id"]

response = client.get_word(customization_id=customization_id, word="HELLO WORLD")

# ...

Ответы [ 2 ]

0 голосов
/ 15 февраля 2019

Оказывается, я использовал неправильный URL и неправильный ключ API.После исправления URL-адреса, который будет действительно «https://gateway -wdc.watsonplatform.net / text-to-speech / api », а также создания и обновления нового текстового сервиса речи на стандартном уровне и использования API этого сервисаКлюч, я смог реализовать двухэтапный процесс, который я упомянул в обновленной части моего вопроса.

0 голосов
/ 10 февраля 2019

Я думаю, что вы неправильно прочитали документацию для сервиса Speech to Text.

Вы можете создать настройку, чтобы изменить то, как корпус использует произношение для обнаружения слов

https://cloud.ibm.com/apidocs/speech-to-text?code=python#add-custom-words

Но для этого вам нужно создать настройку, которую вы можетене делать с лайт аккаунтом.

https://cloud.ibm.com/apidocs/speech-to-text?code=python#create-a-custom-language-model

Вы можете использовать API для просмотра списка уже созданных настроек.

https://cloud.ibm.com/apidocs/speech-to-text?code=python#list-custom-language-models

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...