Google Cloud синхронная речь распознавания аудио файла дает пустой результат - PullRequest
0 голосов
/ 27 марта 2019

Я пытаюсь расшифровать аудиофайл, продолжительность которого меньше минуты, используя облачный API Google. Я копирую код с официального сайта https://cloud.google.com/speech-to-text/docs/sync-recognize но это не дает никакого выхода. Сценарий заканчивается в течение 5-7 секунд, и на экране ничего не отображается. Я ожидаю транскрибированного звука на выходе.

import os
import io
os.environ["GOOGLE_APPLICATION_CREDENTIALS"]="D:\\Rehan\\naufil-0e289431cf2d.json"
def transcribe_file(speech_file):
    """Transcribe the given audio file."""
    from google.cloud import speech
    from google.cloud.speech import enums
    from google.cloud.speech import types
    client = speech.SpeechClient()

    with io.open(speech_file, 'rb') as audio_file:
        content = audio_file.read()

    audio = types.RecognitionAudio(content=content)
    config = types.RecognitionConfig(
        encoding=enums.RecognitionConfig.AudioEncoding.LINEAR16,
        sample_rate_hertz=16000,
        language_code='en-US')

    response = client.recognize(config, audio)
    # Each result is for a consecutive portion of the audio. Iterate through
    # them to get the transcripts for the entire audio file.
    for result in response.results:
        # The first alternative is the most likely one for this portion.
        print(u'Transcript: {}'.format(result.alternatives[0].transcript))

transcribe_file(r"D:\\Rehan\\hey.mp3")

Одно заметное предупреждение может быть, визуальный код говорит [pylint] Module 'google.cloud.speech_v1.types' has no 'RecognitionAudio' member [no-member]. Это просто показывает красную линию под types.RecognitionAudio и types.RecognitionConfig. Хотя это не генерирует никаких ошибок.

...