Поскольку это действительно простая часть, я предполагаю, что вы можете получить аудио с «горячей линии», т. Е. У вас есть прямой доступ к реальным сэмплам.
Трудная часть - это расшифровка аудио. Вы можете начать с просмотра Википедии и перейти по ссылкам оттуда. Одним из решений, которое вы могли бы использовать, было бы CMU Sphinx . Google и другие похожие инструменты поиска, такие как Google Scholar, могут стать вашими близкими друзьями:)
Несмотря на то, что доступно несколько механизмов распознавания голоса, их точность далека от совершенства.