Google Cloud Speech-to-Text и Amazon Transcribe предлагают знаки пунктуации и слова времени . Могу ли я получить знаки препинания? В частности, мне нужны временные метки для разрывов предложений (периоды, вопросительные знаки, восклицательные знаки), например, в 0:33 секунды, 1:01, 1:23, 1:49, 2:05 и т. Д.
Я полагаю, что я мог бы использовать Google или AWS для расшифровки файла с пунктуацией, затем разбить стенограмму на предложения и затем сделать метку времени слова для каждого предложения. Было бы проще (и примерно 1/500 компьютерного времени, для файла с 500 предложениями), если бы я мог просто установить параметр для getPunctuationTimestamps
.
IBM Watson Speech-to-Text предлагает поиск ключевых слов , но не пунктуацию.