Могу ли я вернуть идентификатор строки в другой таблице в зависимости от того, насколько близко совпадение? - PullRequest
0 голосов
/ 01 мая 2019

У меня ежедневно обновляется таблица с информацией о продукте и поставщике.Эти поля могут варьироваться в зависимости от того, как они получены.Например, поставщик может быть указан как «123 Plc», а также «123 Timber Plc».

Продукт «лесоматериалы» может быть указан в списке по любому из названий этих поставщиков, а также «timber2» (снова от 1 поставщика, но может иметь небольшие отклонения).

У меня есть справочная таблица «чистых» данных (т. е. то, что продукт и поставщик в итоге показаны), которые используются для сопоставления с поступающей ежедневной информацией.

Я бы хотел сопоставить каждую строку в ежедневном обновлении с тем, насколько она похожа на основную справочную таблицу

Я нашел код на SO, который выдает процентную близость, основанную на2 строковых значения, и это было полезно, но работает, только если я явно передам ему 2 значения.

Я хотел бы запустить некоторый код, который проходит через каждую запись ежедневного обновления и получает первичный ключсправочная таблица с наибольшим процентным соответствием.

Ref Table:

PK | Product | Supplier        | Concat
1  | Timber  | 123 Timber Plc  | Timber123 Timber Plc

------------------------

Daily update example:

Key | Product | Supplier        | Concat               | Ref PK | Match
1   | Timber  | 123 Timber Plc  | Timber123 Timber Plc | 1      | 100
2   | Timber  | 123 Timber      | Timber123 Timber     | 1      | 85
3   | Timber2 | 123Timber       | Timber2123Timber     | 1      | 65

1 Ответ

0 голосов
/ 01 мая 2019

Вы можете выполнять нечеткие поиски, используя полнотекстовые каталоги.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...