Question

Согласно https://cloud.google.com/speech-to-text/docs/reference/rest/v1beta1/speech/syncrecognize#SpeechRecognitionAlternative выходной объект имеет только следующее:

{
 "transcript": string,
 "confidence": number,
}

Как получить информацию о синхронизации транскрипта здесь?

Ниже приведен фрагмент кода:

from google.cloud import speech_v1p1beta1 as speech

ip = sys.argv[1]
op = sys.argv[2]
# Instantiates a client
client = speech.SpeechClient()

operation = client.long_running_recognize(
    audio=speech.types.RecognitionAudio(
        uri='gs://my-bucket/' + ip,
    ),
    config=speech.types.RecognitionConfig(
        encoding=speech.enums.RecognitionConfig.AudioEncoding.LINEAR16,
        sample_rate_hertz=16000,
        language_code='en-US',
        model='default',#model='video',
    ),
)

Я хочу создать файл субтитров из его выходных данных, поэтому информация о синхронизации имеет решающее значение.

Подробнее: https://cloud.google.com/speech-to-text/docs/reference/libraries#client-libraries-install-python

Как получить информацию о времени в Google речь к тексту клиента Python API?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Как получить информацию о времени в Google речь к тексту клиента Python API?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы