Есть ли способ создать простое приложение, связанное с сообщениями в Django - PullRequest
1 голос
/ 31 июля 2009

По моим кошмарам за последние 4 недели, кажется

Я не могу придумать решение для приложения "похожие посты" в django / python, в котором оно принимает входные данные пользователей и выдает связанный пост, который близко соответствует исходному входу. Я пытался использовать подобные утверждения, но, похоже, они недостаточно чувствительны.

Например, какие опечатки мне нужно принять во внимание.

есть ли библиотека, которая могла бы спасти меня от всей моей боли и страданий?

1 Ответ

2 голосов
/ 31 июля 2009

Ну, я полагаю, есть несколько разных способов нормализовать пользовательский ввод для получения желаемых результатов (хотя я не уверен, в какой степени для них существуют библиотеки). Один из самых простых способов получить похожие сообщения - сравнить теги, присутствующие в этом сообщении (если у ваших сообщений есть теги). Если вы хотите пойти другим путем, я бы предпринял следующие шаги: удалите стоп-слова из темы, используйте какой-то stemmer в оставшейся части и, наконец, обработайте оставшиеся слова как «теги» для сравнения с другими постами. В целях эффективности было бы неплохо выполнить эти шаги в пакетном режиме для всех ваших текущих сообщений и сохранить полученные «теги». Что касается опечаток, я уверен, что существует множество библиотек исправления орфографии (я нашел эту через несколько секунд с Google).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...