Я пытаюсь сделать распознавание речи в текст для WAV. У меня есть файл с Google, Google_Cloud и Houndify.
Я заметил, что с двумя последними они не показывают проблемы с ненормативной лексикой, но распознаватель речи Google фильтрует слово, например, f ***, s ***.
И это создает для меня проблему, так как я хочу провести сентиментальный анализ с LIWC, и программа не дает веса ненормативной лексики для слов, отфильтрованных как f ***.
Я пробовал все вышеперечисленное.
(1) Отключение ненормативной лексики
recognizer_instance.recognize_google(audio_data: AudioData, key: Union[str, None] = None, language: str = "en-US", , pfilter: Union[0, 1], show_all: bool = False) -> Union[str, Dict[str, Any]]
https://github.com/Uberi/speech_recognition/blob/master/reference/library-reference.rst
(2) Удалить цензуру ненормативной лексики из Google Speech Recognition
Но ни один из них не решил проблему
r.recognize_google(example_audio)
---> что, черт возьми, не так с тобой
Но тогда,
r.recognize_google(example_audio, pfilter=0)
Придает
TypeError Traceback (most recent call last)
<ipython-input-21-b158a03c879c> in <module>
----> 1 r.recognize_google(example_audio, pfilter=0)
TypeError: recognize_google() got an unexpected keyword argument 'pfilter'
Как мне решить эту проблему?
Я знаю, что многие решения, написанные на Stackoverflow, ссылаются на распознаватель для Google Cloud API. У меня действительно работает Google_Cloud (r.recognize_google_cloud
), поэтому мне нужно решение для признать_google, а не Google Cloud. Я хочу сравнить результаты.