Я только что быстро проверил сайт, на который вы ссылались.Их алгоритм, по-видимому, сводится к «длинному комментарию == более высокого качества».Не совсем сложный алгоритм.Например, этому
asklfklasf kajslkjf akjs flkajsfklajs fkjaskfj aklsjf kajsfk ajskfj alksjf aklsjfkl asfjaklsjf
был присвоен рейтинг высшего качества ...
Некоторые идеи, чтобы сделать это лучше:
- Проверить орфографию (неправильно введенные слова уменьшаюткачество)
- Проверяйте нецензурные слова и другие ненормативную лексику.
- Длина, вероятно, важна, но я бы не стал придавать этому большое значение.
- Грамматику было бы хорошо проверить, хотя это и сложно.
- Запуск спам-фильтра будет хорошим первым шагом.
Это всего лишь некоторые идеи.Для орфографии и ненормативной лексики, просто проверьте каждое слово по словарю.Грамматика будет сложнее, когда вы начнете переходить к обработке естественного языка, которая является очень глубокой областью исследований.