Я хочу, чтобы Regex только искал орфографические ошибки - как исключить правильное написание? - PullRequest
0 голосов
/ 27 мая 2020

Моя цель - определить слова / фразы, которые были написаны с ошибками.

Я хочу исключить правильные экземпляры из моего поиска. Слово, в котором я хочу идентифицировать все орфографические ошибки, - это «Whats'App» (с апострофом и без него).

Я хочу идентифицировать случаи, когда буква была заменена на число.

Вот мое регулярное выражение, которое хорошо работает для всех экземпляров, включая правильное написание. Я хочу, чтобы код исключил следующие два слова; WhatsApp и Whats'App.

Я использую это в Elasti c.

wh[a4]t[s5]’?[a4]pp

1 Ответ

1 голос
/ 28 мая 2020

Всем спасибо за помощь. Решение этого вопроса заключалось в том, чтобы исключить правильные экземпляры, используя @&~(abc.+). Я нашел ответ на сайте eslatics .

Вот запрос, который теперь работает;

wh[a4]t[s5]’?[a4]p+@&~(whats’?ap+)

К сожалению, у меня есть некоторые неожиданные результаты, в которых некоторые орфографические ошибки не определены . Это должно быть связано с другой проблемой в этом запросе, который я опубликую как отдельный вопрос.

Спасибо, Шон

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...