Как исправить плохо написанные электронные письма? - PullRequest
0 голосов
/ 20 декабря 2018

Я пытаюсь исправить плохо написанные электронные письма, содержащиеся в списке, путем поиска различий в наиболее распространенных доменах.Например: hotmal.com на hotmail.com.Дело в том, что существует множество вариантов одного домена.Было бы чрезвычайно полезно, если бы кто-то знал об алгоритме на python, который может работать как автозамена для почтовых доменов.Или, если это слишком сложная проблема для нескольких строк кода.

Ответы [ 3 ]

0 голосов
/ 20 декабря 2018

Напишите небольшой скрипт на предпочитаемом вами языке, который принимает домены, начинающиеся с h и заканчивающиеся на l, и заменяет всю строку на hotmail, чтобы исправить все между ними.Ищите маи, если они забыли Л. Я должен был сделать это на днях на vb.net, поэтому дважды проверьте мои списки и исправьте неверные данные.

0 голосов
/ 21 декабря 2018

Что делать, если ... вы ищете ключевые слова в домене.Как и на hotmail.com, вы можете искать горячие или что-то подобное.Также, как писал @ user10817019, вы можете комбинировать его с поиском первых и последних букв домена.

0 голосов
/ 20 декабря 2018

Проверка Расстояние Левенштейна начиная с https://en.wikipedia.org/wiki/Levenshtein_distance Обычно используется для автокоррекции

...