Длинные стенограммы из локального хранилища - PullRequest
0 голосов
/ 27 апреля 2020

Здравствуйте, я пытаюсь расшифровать длинные видеофайлы (около 90 минут). Когда я пытаюсь запустить этот код, я получаю эту ошибку: google.api_core.exceptions.InvalidArgument: 400 Размер полезной нагрузки запроса превышает ограничение: 10485760 байт.

Интересно, существует ли ограничение для размера файла, когда загрузка его локально вместо использования облачного хранилища.

код:

from google.cloud import speech_v1
from google.cloud.speech_v1 import enums
import io


def sample_recognize():
    """
    Transcribe a short audio file using a specified transcription model

    Args:
      local_file_path Path to local audio file, e.g. /path/audio.wav
      model The transcription model to use, e.g. video, phone_call, default
      For a list of available transcription models, see:
      https://cloud.google.com/speech-to-text/docs/transcription-model#transcription_models
    """

    client = speech_v1.SpeechClient()

    local_file_path = 'class.flac'
    model = 'default'

    # The language of the supplied audio
    language_code = "pt-PT"
    config = {"model": model, "language_code": language_code}
    with io.open(local_file_path, "rb") as f:
        content = f.read()
    audio = {"content": content}

    response = client.recognize(config, audio)
    for result in response.results:
        # First alternative is the most probable result
        alternative = result.alternatives[0]
        print(u"Transcript: {}".format(alternative.transcript))
sample_recognize()
...