Предложение по поиску похожих строк в Mysql - PullRequest
1 голос
/ 03 июля 2010

Я хочу выбрать похожие строки в соответствии с заголовком строки.Заголовок columun имеет в основном 5 или 6 шести ключевых слов.Какой алгоритм вы рекомендуете?Soundex Может быть?

PS: Название columun имеет такие символы Юникода, как Ç, Ö, Ş ...

Ответы [ 3 ]

2 голосов
/ 09 июля 2010

Ответ на мой вопрос MySQL полнотекстовый поиск. Также он поддерживает Unicode.

    SELECT *, match(project_title) against('sample project 55') as similarity
    FROM projects
    WHERE status IN(1, 2, 3, 4, 5, 6) AND id != ? AND match('sample project 55') against(?)
    ORDER BY similarity DESC
0 голосов
/ 03 июля 2010

Честно говоря, я бы создал таблицу для keywords(id, external_id, keyword), а затем я бы соединил таблицу против себя, упорядочил по количеству совпадений и затем вытащил строки обратно.

Если вы сравниваете одну строку, вы можете выбрать только эту, чтобы повысить эффективность при объединении.

Это может быть объединено с SOUNDEX для сопоставления близких вещей

0 голосов
/ 03 июля 2010

Если вы имеете в виду подобное в написании и произношении, я бы хотел воспользоваться функцией SOUNDEX.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...