У меня есть два списка, содержащие имена клиентов. Имена могут быть похожими или разными. Как найти сходство между этими двумя списками, используя python?
После сходства я хочу получить соответствующие данные из одного файла Excel в другой.
пример:
Список 1:
Customer Name Unique ID
IBM 2365
BOA 5456
BMW AG 2456
Список 2:
Customer Name Unique ID
IBM Pvt Ltd
BMW Group
Robert Bosch
BOA Ltd
Это просто пример данных. Фактические данные содержат почти 300 тыс. Строк.
Я попробовал Сходство по Джакарду, передав два списка отдельно в виде файлов Excel в функцию, но результат (т. Е. Сходство по Джакарду) всегда равен нулю.
Редактировать: Как перебрать оба списка, сравнить каждый элемент со всеми элементами другого списка и построить матрицу расстояний?
Затем я хотел бы отсортировать каждую строку этой матрицы в порядке убывания, чтобы узнать наиболее близкое соответствие между ними. Или есть какой-то другой лучший способ узнать наиболее близкое совпадение после построения матрицы?