Может ли кто-нибудь помочь мне отключить фильтр ненормативной лексики для распознавания речи Google? - PullRequest
1 голос
/ 16 мая 2019

Я пытаюсь сделать распознавание речи в текст для WAV. У меня есть файл с Google, Google_Cloud и Houndify.

Я заметил, что с двумя последними они не показывают проблемы с ненормативной лексикой, но распознаватель речи Google фильтрует слово, например, f ***, s ***.

И это создает для меня проблему, так как я хочу провести сентиментальный анализ с LIWC, и программа не дает веса ненормативной лексики для слов, отфильтрованных как f ***.

Я пробовал все вышеперечисленное.

(1) Отключение ненормативной лексики

recognizer_instance.recognize_google(audio_data: AudioData, key: Union[str, None] = None, language: str = "en-US", , pfilter: Union[0, 1], show_all: bool = False) -> Union[str, Dict[str, Any]]

https://github.com/Uberi/speech_recognition/blob/master/reference/library-reference.rst

(2) Удалить цензуру ненормативной лексики из Google Speech Recognition

Но ни один из них не решил проблему

r.recognize_google(example_audio)

---> что, черт возьми, не так с тобой

Но тогда,

r.recognize_google(example_audio, pfilter=0)

Придает

TypeError                                 Traceback (most recent call last)
<ipython-input-21-b158a03c879c> in <module>
----> 1 r.recognize_google(example_audio, pfilter=0)

TypeError: recognize_google() got an unexpected keyword argument 'pfilter'

Как мне решить эту проблему?

Я знаю, что многие решения, написанные на Stackoverflow, ссылаются на распознаватель для Google Cloud API. У меня действительно работает Google_Cloud (r.recognize_google_cloud), поэтому мне нужно решение для признать_google, а не Google Cloud. Я хочу сравнить результаты.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...