Речевые знаки препинания? - PullRequest
0 голосов
/ 21 июня 2019

Google Cloud Speech-to-Text и Amazon Transcribe предлагают знаки пунктуации и слова времени . Могу ли я получить знаки препинания? В частности, мне нужны временные метки для разрывов предложений (периоды, вопросительные знаки, восклицательные знаки), например, в 0:33 секунды, 1:01, 1:23, 1:49, 2:05 и т. Д.

Я полагаю, что я мог бы использовать Google или AWS для расшифровки файла с пунктуацией, затем разбить стенограмму на предложения и затем сделать метку времени слова для каждого предложения. Было бы проще (и примерно 1/500 компьютерного времени, для файла с 500 предложениями), если бы я мог просто установить параметр для getPunctuationTimestamps.

IBM Watson Speech-to-Text предлагает поиск ключевых слов , но не пунктуацию.

1 Ответ

0 голосов
/ 27 июня 2019

Я пробовал поиск ключевых слов IBM Watson Speech-to-Text .Я предоставил 48-минутный подкаст Radio Ambulante, который имеет официальную расшифровку.Это для высококачественного подкаста NPR.Я выбрал одно предложение из стенограммы в качестве «ключевого слова», чтобы найти.Уотсону понадобилось около 48 минут для расшифровки 48-минутного подкаста.Хозяин транскрибировал лучше, чем 90%, а опрошенные были лучше, чем 80%.Проблема была в том, что для работы мне нужна 100% точность.Например, кубинский врач говорит: «Эй, мне, кажется, не комуниста» («я не считал себя коммунистом»), но Ватсон слышал «соображения кому есто».Уотсон так и не нашел целевого предложения.

...