У меня ежедневно обновляется таблица с информацией о продукте и поставщике.Эти поля могут варьироваться в зависимости от того, как они получены.Например, поставщик может быть указан как «123 Plc», а также «123 Timber Plc».
Продукт «лесоматериалы» может быть указан в списке по любому из названий этих поставщиков, а также «timber2» (снова от 1 поставщика, но может иметь небольшие отклонения).
У меня есть справочная таблица «чистых» данных (т. е. то, что продукт и поставщик в итоге показаны), которые используются для сопоставления с поступающей ежедневной информацией.
Я бы хотел сопоставить каждую строку в ежедневном обновлении с тем, насколько она похожа на основную справочную таблицу
Я нашел код на SO, который выдает процентную близость, основанную на2 строковых значения, и это было полезно, но работает, только если я явно передам ему 2 значения.
Я хотел бы запустить некоторый код, который проходит через каждую запись ежедневного обновления и получает первичный ключсправочная таблица с наибольшим процентным соответствием.
Ref Table:
PK | Product | Supplier | Concat
1 | Timber | 123 Timber Plc | Timber123 Timber Plc
------------------------
Daily update example:
Key | Product | Supplier | Concat | Ref PK | Match
1 | Timber | 123 Timber Plc | Timber123 Timber Plc | 1 | 100
2 | Timber | 123 Timber | Timber123 Timber | 1 | 85
3 | Timber2 | 123Timber | Timber2123Timber | 1 | 65