Использование расширенной модели в Google Cloud Speech API - PullRequest
0 голосов
/ 28 апреля 2018

Я пытаюсь использовать расширенные модели в Google Speech API, например:

gcs_uri="gs://mybucket/averylongaudiofile.ogg"

client = speech.SpeechClient()

audio = types.RecognitionAudio(uri=gcs_uri)
config = types.RecognitionConfig(
        encoding=enums.RecognitionConfig.AudioEncoding.OGG_OPUS,
        language_code='en-US',
        sample_rate_hertz=48000,
        use_enhanced=True,
        model='phone_call',
        enable_word_time_offsets=True,
        enable_automatic_punctuation=True)

operation = client.long_running_recognize(config, audio)

Я включил ведение журнала данных, чтобы использовать расширенную модель в настройках «Cloud Speech API» для моего проекта

Когда я запускаю его, он выдает следующую ошибку:

Traceback (most recent call last):   File "./transcribe.py", line 126, in <module>
    enable_automatic_punctuation=True) ValueError: Protocol message RecognitionConfig has no "use_enhanced" field.

Есть предложения?

1 Ответ

0 голосов
/ 30 апреля 2018

Вы можете использовать «use_enhanced» в типе RecognitionConfig в пакете v1p1beta1 .

Чтобы иметь возможность запустить ваш пример, вам просто нужно изменить импортируемый файл следующим образом:

import google.cloud.speech_v1p1beta1 as speech
gcs_uri="gs://mybucket/averylongaudiofile.ogg"

client = speech.SpeechClient()
audio = speech.types.RecognitionAudio(uri=gcs_uri)
config = speech.types.RecognitionConfig(
        encoding=speech.enums.RecognitionConfig.AudioEncoding.OGG_OPUS,
        language_code='en-US',
        sample_rate_hertz=48000,
        use_enhanced=True,
        model='phone_call',
        enable_word_time_offsets=True,
        enable_automatic_punctuation=True)
operation = client.long_running_recognize(config, audio)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...