Python Speech Compare - PullRequest
       23

Python Speech Compare

5 голосов
/ 23 февраля 2012

У меня есть два WAV-файла, которые мне нужно сравнить и решить, содержат ли они одинаковые слова (тоже в том же порядке).

Я уже некоторое время ищу лучший метод. Я не могу понять, как заставить pyspeech использовать файл в качестве входных данных. Я пытался заставить проект CMU sphinx работать, но я не могу заставить GStreamer работать с Python 27, не говоря уже об их проекте. Я тоже бездельничал с DragonFly.

Я использую Win7 64bit с Python27. У кого-нибудь есть какие-либо идеи?

Любая помощь очень ценится.

1 Ответ

4 голосов
/ 24 февраля 2012

Вы можете попробовать PySpeech . Для получения дополнительной информации см. pyspeech (python) - транскрибировать mp3-файлы? . Я никогда не использовал это, но я полагаю, что он использует встроенный механизм распознавания речи Windows. Это позволит вам конвертировать файлы Wav в текст, а затем вы можете сравнить текст.

Чтобы использовать речевой движок Windows и использовать для ввода wav-файл, есть два требования.

  1. Используйте встроенный распознаватель (SpeechRecognitionEngine). Общие распознаватели не могут использовать файлы Wav в качестве входных данных.
  2. В объекте распознавателя вызовите SetInputToWaveFile, чтобы указать входной wav-файл.

Возможно, вам придется заново сэмплировать файлы wav, потому что механизмы распознавания речи поддерживают только определенные частоты дискретизации.

  • 8 бит на выборку
  • одноканальный моно
  • 22 050 выборок в секунду
  • кодировка PCM

хорошо работает в Windows. См. https://stackoverflow.com/a/6203533/90236 для получения дополнительной информации.

Для получения дополнительной информации о механизмах речи Windows вы можете взглянуть на SAPI и Windows 7 Проблема и В чем разница между System.Speech.Recognition и Microsoft.Speech.Recognition

...