Question

Я пытался преобразовать один 60-метровый аудиофайл в текст, но у меня возникли проблемы с gs url.Сообщение об ошибке показывает сообщение протокола. RecognitionConfig не имеет поля «uri». Я пробовал несколько способов поместить здесь gs uri, но, похоже, не работает.

from google.cloud import speech_v1p1beta1 as speech
import os
import io

os.environ["GOOGLE_APPLICATION_CREDENTIALS"] = "./SpeechToText-32140aeda073.json"

client = speech.SpeechClient()

encoding = speech.enums.RecognitionConfig.AudioEncoding.AMR

audio_source = speech.types.RecAognitionConfig(uri=gsc_uri)
gsc_uri = 'gs://interview_uio/Han.wav'

with io.open(audio_source, 'rb') as audio_file:
    content = audio_file.read()

config = speech.types.RecognitionConfig(
    encoding=speech.enums.RecognitionConfig.AudioEncoding.AMR,
    sample_rate_hertz=8000,
    language_code='en-US',
    audio_channel_count=1,
    enable_automatic_punctuation=True)
uri = 'gs://interview_uio/Han.wav'
audio = {'uri': uri}

operation = client.long_running_recognize(config, audio)

print('Waiting for operation to complete...')
response = operation.result(timeout=90)

for i, result in enumerate(response.results):
    alternative = result.alternatives[0]
    print('-' * 20)
    print('First alternative of result {}'.format(i))
    print('Transcript: {}'.format(alternative.transcript))

Google речь в текст: протокол сообщения RecognitionConfig не имеет поля "URI"

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Google речь в текст: протокол сообщения RecognitionConfig не имеет поля "URI"

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы