Я хочу разбить слово на слоги. Я пытаюсь построить систему преобразования речи в текст, но сосредоточился на расшифровке медицинских терминов.
Представьте себе врача / фармацевта, который вместо того, чтобы вводить дозировку лекарства, просто говорил бы в микрофон, и цифровой рецепт был бы генерируется автоматически. Я хочу избегать подходов, основанных на ML / DL, поскольку я хотел, чтобы система работала в режиме реального времени. Поэтому я хотел решить эту проблему с помощью словарного подхода. Я отказался от rxlist.com
, чтобы получить все возможные названия лекарств. В настоящее время я использую API-интерфейс webspeech (https://www.google.com/intl/en/chrome/demos/speech.html). Это работает хорошо, но часто путает названия лекарств. нестабильный). Также важно учитывать, что панадол является относительно простым термином . Рассмотрим викодин (заменен на «почему не может»), абакавир сульфат и др. c.
Вот подход, который, как я думал, может сработать.
- Вести словарь всех лекарств .
- После обнаружения (я добавляю все обнаружения, а не просто использую последний результат), сравните расстояние строки от каждого лекарства (может быть огромным, поэтому здесь важна сортировка) и замените слово на минимальная ошибка.
- Если ничего не совпадает (поддерживайте порог ошибки на шаге 2), проверьте слоги предсказания и слоги названия лекарства и замените один с наименьшей ошибкой.
Итак, у меня теперь есть список, я надеялся, что смогу найти API библиотеки / словаря, который мог бы дать мне слоги названий лекарств. Набрав How to pronounce vicodin
в Google, вы получите панель «Научиться произносить», в которой есть: vai · kuh · dn. Я бы хотел что-то подобное, теперь я могу убрать это из Google, но я не получаю результатов для всех названий лекарств.
Любая помощь будет принята с благодарностью.
Спасибо.