MySQL запрос для проверки определенных фраз (дубликат статьи, плагиат) - PullRequest
2 голосов
/ 11 октября 2010

Есть ли способ проверить наличие нескольких фраз в mysql?

Мне нужно проверить, есть ли в статье дублированная версия, хранящаяся в mysql.

По этому алгоритму я сначала создаю массив предложений, которые необходимо проверить (удаляя все не буквенно-цифровые символы), затем создаю запрос (как?). После получения результата я сравниваю, если 50%из предложений являются дубликатами, чем я считаю статью дубликатом.Статьи в таблице хранятся с удаленными не буквенно-цифровыми символами.Пример:

iamdevelopingatooltocheckduplicatearticlesstoredinmysqldatabasehoweveriveencountered 

Есть предложения?

1 Ответ

1 голос
/ 11 октября 2010

Да, загляните в «Программирование Коллективного Разума», чтобы узнать об этих алгоритмах.Они связаны с группировкой.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...