извлечение буквенно-цифровой строки из речи клиента - PullRequest
0 голосов
/ 11 февраля 2019

Я сейчас работаю над голосовым ботом.У меня проблемы с извлечением номера карты панорамы (hazwr2312g).Клиент может дать это по-разному.например, они могут сказать, что мой идентификатор панорамирования (hazwr2312g).

Я создал регулярное выражение на основе правил панорамирования, которое работает нормально / [az] {3} [abcfghljpte] [az] [0-9] {4} [az] / i и извлеките номер панорамирования.

Однако, когда клиент дает номер панорамирования с помощью голоса, в конце «g» часто заменяется на «ji» (hazwr2312 ji).предложение.

различные высказывания:

1) номер моей сковороды - hazwr2312 ji 2) hazwr2312 ji - это номер моей сковороды 3) это hazwr2312 ji 4) хм, хм, мой идентификатор: hazwr2312 ji

и т. Д.

как я могу справиться с этим?Пожалуйста, ведите меня

С наилучшими пожеланиями

1 Ответ

0 голосов
/ 11 февраля 2019

вы можете попробовать, используя regex, или вы также выбрали split, indexOf и т. Д., Если у вас есть определенный тип ключевого слова, которое встречается постоянно или часто.

...