Regex Elasti c Используется запрос, не идентифицирующий не все экземпляры буквального апострофа - PullRequest
0 голосов
/ 28 мая 2020

Моя цель - выявить все «умышленные» орфографические ошибки в словах «whatsapp» и «whats'app» (где a и s заменены на 4 и 5 и где апостроф может быть или не использоваться после s / 5). Мой запрос должен исключать правильные варианты написания whatapp и whats'app.

... этот запрос почти работает;

wh[a4]t[s5]’?[a4]p+@&~(whats’?ap+)

Он исключает правильное написание и определяет многие орфографические ошибки, когда a и s заменяются на 4 и 5, и это допускает случаи, когда используются только один или два p.

Однако он не определяет многие случаи, когда используется апостроф! Он будет идентифицировать подобные Wh4tsapp What5app Whats4pp Wh4t5app Wh4ts4pp и даже Wh4ts'app, но не идентифицирует подобные What5'app Whats'4pp Wh4t5'app Wh4ts'4pp

Есть предложения?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...