У меня есть две таблицы, каждая из которых предоставляет информацию о группе приложений, работающих в сети моей работы.Они были созданы двумя отдельными людьми, которые никогда не казались соответствующими.
В результате имена, которые они дали приложениям, не являются постоянными между листами.Они, однако, похожи.Например, одно может называть приложение «Office 2010», другое - «MS Office 10» или что-то в этом роде.
Я посмотрел алгоритм Левенштейна, но, похоже, это применимо только к отдельным словам или фразам, гдепорядок слов постоянен, и отличается только правописание.(Я не специалист по информатике; не стесняйтесь поправлять меня в этом).
Поэтому я ищу алгоритм, который для каждого имени на одном листе может перебирать каждое имя на другом листе и находитьближайший матч.Не обязательно быть идеальным, все поможет.
Есть идеи?Спасибо всем, кто может помочь.