У меня есть файл Excel, который содержит более 1000 наименований компаний в одном столбце и около 20 000 наименований компаний в другом столбце.
Цель состоит в том, чтобы найти как можно больше имен.Проблема в том, что имена в первом столбце (1000 +) плохо отформатированы, что означает, что строка «Название компании» может выглядеть примерно как "9Com (panynAm9e00" . Я пытаюсьчтобы выяснить лучший способ решить эту проблему (точно совпадают только 12 имен)
Попробовав разные методы, я попытался сопоставить 4-5 или более символов в каждом имени, в зависимости отдлина каждой строки с использованием регулярных выражений. Но я просто пытаюсь найти наиболее эффективный способ сделать это.
Например:
Столбец 1
1. 9Com(panynAm9e00
2. NikE4
3. Mitrosof2
Столбец 2
1. Microsoft
2. Company Name
3. Nike
Возьмите первый элемент в Столбец 1 и найдите совпадение в Столбец 2 .Если нет точного соответствия, ищите строку с 4-5 одинаковыми символами.
Есть предложения?