Согласно https://cloud.google.com/speech-to-text/docs/reference/rest/v1beta1/speech/syncrecognize#SpeechRecognitionAlternative выходной объект имеет только следующее:
{
"transcript": string,
"confidence": number,
}
Как получить информацию о синхронизации транскрипта здесь?
Ниже приведен фрагмент кода:
from google.cloud import speech_v1p1beta1 as speech
ip = sys.argv[1]
op = sys.argv[2]
# Instantiates a client
client = speech.SpeechClient()
operation = client.long_running_recognize(
audio=speech.types.RecognitionAudio(
uri='gs://my-bucket/' + ip,
),
config=speech.types.RecognitionConfig(
encoding=speech.enums.RecognitionConfig.AudioEncoding.LINEAR16,
sample_rate_hertz=16000,
language_code='en-US',
model='default',#model='video',
),
)
Я хочу создать файл субтитров из его выходных данных, поэтому информация о синхронизации имеет решающее значение.
Подробнее: https://cloud.google.com/speech-to-text/docs/reference/libraries#client-libraries-install-python