Пользователь представил фильтрацию контента - PullRequest
2 голосов
/ 06 апреля 2010

Есть ли у кого-нибудь идеи о том, что можно использовать в качестве способа фильтрации ненадежного контента, отправляемого пользователями?

Возьмем, к примеру, Yelp, им нужно будет помешать конкурентам писать деловые отзывы о своих конкурентах.Им нужно будет помешать владельцам бизнеса положительно пересмотреть свой собственный бизнес или заставить друзей / семью сделать это.Им нужно было бы не допустить, чтобы некачественные обзоры не влияли на рейтинг предприятий и т. Д.

Я не могу думать, что они могут использовать для этого:

  • Запретить нескольким пользователямПроверка того же IP-адреса определенных вещей
  • Предотвращение рецензирования владельцами бизнеса своего собственного бизнеса (возможно, даже других предприятий тех же категорий, что и их собственные?)
  • Каким-то образом определить, что такое обзор и каковы его реальные намерения.за этим стоит

Кроме первого и второго пунктов, я не могу придумать какой-либо умный / простой способ отфильтровать потенциально опасные обзоры из доступных, кроме того, как это делает человек.Очевидно, что для сайта размером с Yelp это было бы неосуществимо, поэтому какие параметры они могли бы принять во внимание?Даже с человеческим вмешательством, как кто-то мог знать, что это был лучший друг владельцев, написавший фальшивый отзыв, не зная людей?

Я использую это в качестве примера в более широком исследовании на тему автоматической фильтрации пользовательского контента.,У кого-нибудь есть идеи, как эти системы могут работать и что они принимают во внимание?

Спасибо!

Ответы [ 2 ]

2 голосов
/ 07 апреля 2010

Я бы сказал Захарию, что он не может реально запретить людям публиковать сообщения по какой-либо конкретной причине.

Лучше всего ожидать, что будут плохие или хитрые обзоры, спам, идиоты, пытающиеся испортить его для всех нас, но также и то, что большинство людей доброжелательны. Переполнение стека было построено на этих идеях. Итак:

  1. Ведите словарь IP-адресов и присваивайте каждому оценку. Ограничьте частоту, с которой данный IP может публиковать несколько обзоров, и, если они попытаются заполнить систему, система заблокирует IP на некоторое время. Таким образом, чем хуже они себя ведут, тем труднее для них.
  2. Пусть пользователи сайта оценивают каждый отзыв - Amazon делает это с «Был ли этот отзыв полезным?».
  3. Наряду с 2., сохраняйте оценку для каждого пользователя (публично или в частном порядке), например, оценку репутации SO, и используйте ее для ограничения действий новых или плохо ведущих себя пользователей. Если ваша репутация слишком низкая, вы не можете оценивать чужие отзывы. Slashdot позволяет вам выбирать, отфильтровывать ли ответы с низкой оценкой.
  4. Позвольте бизнесу выдвинуть свою сторону вещей в специальном обзоре, который находится в верхней части списка (и пометить его как таковой), чтобы у них было где-то сказать весь пух, который они должны сказать.
  5. Обратите внимание на принцип наказания и вознаграждения за поведение, а не за человека. Таким образом, люди, которые ведут себя немного нехорошо, могут быть исправлены и превращены в продуктивных участников, так как в любом случае они часто требуют внимания.
  6. Хороните низко набранные ответы внизу списка, точно так же, как ответы SO заказов. Таким образом, стремление к вниманию побуждает пользователей создавать качественные обзоры, а не отправлять FAKE !!!! 11 !!
  7. Прочитайте блог Джеффа Этвуда Coding Horror ; и слушайте SO записи подкаста по порядку. Там есть шахта опыта.
2 голосов
/ 06 апреля 2010

Третий кажется совершенно невозможным, без компьютера, способного читать мысли пользователя, и на этом этапе это все еще будет вторжением в личную жизнь. Несмотря на свои причины, люди должны иметь возможность что-то анализировать, основываясь на любых критериях, которые они хотят.

Я думаю, что основанный на обзоре веб-сайт, такой как IMDB или yelp, сделал бы пару других вещей:

  1. Требуется, чтобы пользователь либо оценивал столько предметов, либо был участником в течение определенного периода времени, прежде чем их рейтинги действительно что-то значат.

  2. Надеюсь, что количество обзоров достаточно велико, так что несколько выбросов в любой из крайностей не влияют на среднее. Вы можете рассмотреть возможность использования алгоритма, отличного от чистого среднего, для расчета итоговой оценки - возможно, вместо этого используйте медиану.

...