Мне нужен алгоритм для измерения качества контента - PullRequest
0 голосов
/ 28 июня 2011

есть ли алгоритм измерения качества контента? http://www.the -top-tens.com / в десятках лучших, когда вы голосуете за элемент, появляется поле для комментариев, и когда вы начинаете писать, почему вы голосуете за этот элемент, он автоматически комментирует то, что вы пишете. Мне интересно, как они это делают?

Я приму этот алгоритм для WordPress. Я думаю, что это будет идеально для пользователей WordPress.

1 Ответ

1 голос
/ 28 июня 2011

Я только что быстро проверил сайт, на который вы ссылались.Их алгоритм, по-видимому, сводится к «длинному комментарию == более высокого качества».Не совсем сложный алгоритм.Например, этому

asklfklasf kajslkjf akjs flkajsfklajs fkjaskfj aklsjf kajsfk ajskfj alksjf aklsjfkl asfjaklsjf

был присвоен рейтинг высшего качества ...

Некоторые идеи, чтобы сделать это лучше:

  • Проверить орфографию (неправильно введенные слова уменьшаюткачество)
  • Проверяйте нецензурные слова и другие ненормативную лексику.
  • Длина, вероятно, важна, но я бы не стал придавать этому большое значение.
  • Грамматику было бы хорошо проверить, хотя это и сложно.
  • Запуск спам-фильтра будет хорошим первым шагом.

Это всего лишь некоторые идеи.Для орфографии и ненормативной лексики, просто проверьте каждое слово по словарю.Грамматика будет сложнее, когда вы начнете переходить к обработке естественного языка, которая является очень глубокой областью исследований.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...