Есть ли способ ввести пунктуацию в итальянское предложение с python? - PullRequest
0 голосов
/ 16 марта 2020

, как следует из названия, мне нужен API для введения пунктуации в итальянское предложение.

Я использую SpeechRecognition для преобразования речи в текст, но код, который я реализовал, дает мне в качестве вывода предложение без пунктуация.

Мой код следующий:

import speech_recognition as sr

recognizer_instance = sr.Recognizer()

with sr.Microphone() as source:
    recognizer_instance.adjust_for_ambient_noise(source)
    print("I'm listening... say something!")
    audio = recognizer_instance.listen(source)
    print("Ok! I'm processing the message!")
try:
    text = recognizer_instance.recognize_google(audio, language="it-IT")
    print("Google understood: \n", text)
except Exception as e:
    print(e)

Если я скажу, во время исполнения, это предложение:

"Mi chiamo Paolo. Tu? «

, что означает« Меня зовут Паоло. Ваше? »

Вывод будет следующим:

Я слушаю ... скажи что-нибудь!
Хорошо! Я обрабатываю сообщение!
Google понял:
mi chiamo Paolo tu

, который не учитывает пунктуацию. Как я могу вставить эту информацию?

Спасибо!

1 Ответ

1 голос
/ 16 марта 2020

Google Speech Recognition API поддерживает пунктуацию для итальянского, но вам необходимо установить enable_automatic_punctuation=True в конфигурации распознавания (см. здесь ). Запрос на добавление, добавляющий эту функцию в библиотеку SpeechRecognition, в настоящее время открыт на GitHub . На данный момент вы можете использовать Google API напрямую или попытаться добавить пунктуацию в качестве шага постобработки (кажется, что нужно приложить немало усилий, так как это, скорее всего, потребует обучения модели, подобной Punctuator ).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...