Как получить все слоги слова в Python? - PullRequest
0 голосов
/ 05 августа 2020

Я хочу разбить слово на слоги. Я пытаюсь построить систему преобразования речи в текст, но сосредоточился на расшифровке медицинских терминов.

Представьте себе врача / фармацевта, который вместо того, чтобы вводить дозировку лекарства, просто говорил бы в микрофон, и цифровой рецепт был бы генерируется автоматически. Я хочу избегать подходов, основанных на ML / DL, поскольку я хотел, чтобы система работала в режиме реального времени. Поэтому я хотел решить эту проблему с помощью словарного подхода. Я отказался от rxlist.com, чтобы получить все возможные названия лекарств. В настоящее время я использую API-интерфейс webspeech (https://www.google.com/intl/en/chrome/demos/speech.html). Это работает хорошо, но часто путает названия лекарств. нестабильный). Также важно учитывать, что панадол является относительно простым термином . Рассмотрим викодин (заменен на «почему не может»), абакавир сульфат и др. c.

Вот подход, который, как я думал, может сработать.

  1. Вести словарь всех лекарств .
  2. После обнаружения (я добавляю все обнаружения, а не просто использую последний результат), сравните расстояние строки от каждого лекарства (может быть огромным, поэтому здесь важна сортировка) и замените слово на минимальная ошибка.
  3. Если ничего не совпадает (поддерживайте порог ошибки на шаге 2), проверьте слоги предсказания и слоги названия лекарства и замените один с наименьшей ошибкой.

Итак, у меня теперь есть список, я надеялся, что смогу найти API библиотеки / словаря, который мог бы дать мне слоги названий лекарств. Набрав How to pronounce vicodin в Google, вы получите панель «Научиться произносить», в которой есть: vai · kuh · dn. Я бы хотел что-то подобное, теперь я могу убрать это из Google, но я не получаю результатов для всех названий лекарств.

Любая помощь будет принята с благодарностью.

Спасибо.

1 Ответ

0 голосов
/ 05 августа 2020

Вы можете использовать библиотеку под названием pyphen. Пользоваться им довольно просто. Чтобы установить его, выполните следующую команду в своем терминале:

pip install pyphen

После этого найдите слоги в строке:

import pyphen
a = pyphen.Pyphen(lang='en')
print(a.inserted('vicodin'))

Надеюсь, вы найдете это полезным

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...