Что-то, что я делал, довольно просто и работает в большинстве сценариев (В моем сценарии у меня есть 6,7 миллиона имен событий, из грязной таблицы, в которой есть слегка измененные или детализированные версии имен событий, и таблица, с которой я нечетко сопоставляю, имеет все чистые имена событий)
``select distinct a.Column, b.Column
from tableA a
inner join tableB b
on '%' + SUBSTRING(b.Column, x, y) + '%' = '%' + SUBSTRING(a.Column, x, y) + '%'
order by a.Column asc;``
Моя проблема в том, что, если бы я просто провел нечеткое сопоставление без подстроки, я получил бы только около 11 результатов из-за того, насколько неясными были соглашения об именах между ними. Это решение показывает, что все события детализации при детализации сопоставляются с их более широкими аналогами в чистой таблице.