Комплексное сравнение строк SQL - PullRequest
0 голосов
/ 21 ноября 2011

Я объединяю две базы данных для клиента. В идеальном мире я просто использовал бы уникальный идентификатор, чтобы присоединиться к ним, но в этом случае более новая таблица имеет другие идентификаторы.

Так что мне нужно объединить таблицы в другом столбце. Для этого мне нужно использовать сложный оператор LIKE, чтобы присоединиться к полю заголовка. Но ... они изменили заголовки некоторых строк, что нарушает объединение этих строк.

Как мне написать сложный оператор LIKE, чтобы связать немного разные заголовки?

Например:

Table 1 Title = Freezer/Pantry Storage Basket
Table 2 Title = Deep Freezer/Pantry Storage Basket

или

Table 1 Title = Buddeez Bread Buddy
Table 2 Title = Buddeez Bread Buddy Bread Dispenser

Опять же, есть сотни строк с заголовками, которые немного отличаются друг от друга, но непоследовательно отличаются.

Спасибо!

UPDATE:

Как далеко может зайти мой полнотекстовый поиск MySQL? Похоже на предложение Акулы в SQL Server.

http://dev.mysql.com/doc/refman/5.0/en/fulltext-search.html

Ответы [ 2 ]

1 голос
/ 21 ноября 2011

Делайте это поэтапно. Сначала соберите все подходящие варианты, чтобы вы работали только с исключениями. Ваш ум невероятно умнее, чем компьютер, находит вещи, которые «похожи» друг на друга, поэтому сканируйте данные, ищите сходства и делайте SQL-заявления, которые покрывают конкретные случаи, которые вы видите, до тех пор, пока вы не сузите их как можно больше. 1001 *

У вас будут лучшие результаты, если вы «поможете» компьютеру на таких этапах, как если бы вы попытались разработать большую программу, охватывающую все случаи сразу.

Конечно, есть, конечно, apis, которые уже делают это (например, тот, который Google использует, чтобы угадать вашу поисковую фразу, прежде чем вы ее закончите), но есть ли они в свободном доступе, я не знаю. Конечно, не мешало бы его найти.

1 голос
/ 21 ноября 2011

Довольно сложно описать «только немного другое» так, как компьютер может это понять.Я предлагаю выбрать группу определенных критериев, которые можно считать наиболее распространенными или наиболее важными, и обойти ее.Однако я не уверен, какими должны быть эти критерии, поскольку я имею лишь смутное представление о том, как выглядит набор данных.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...