Как обеспечить правильность данных, собранных с помощью краудсорсинга? - PullRequest
4 голосов
/ 24 апреля 2009

У меня есть сайт, где пользователи вводят данные о некоторых продуктах, которые они покупают.

Как обеспечить правильность данных, вводимых с помощью краудсорсинга (позволяя пользователям голосовать / редактировать продукты), сводя к минимуму объем работы, который должен выполнять администратор? Я ищу некоторые инструкции, лучшие практики и т. Д.

Ответы [ 3 ]

2 голосов
/ 24 апреля 2009

Какие данные вы собираете?

Вы говорите о краудсорсинге и, таким образом, (я полагаю) агрегации данных в этой толпе. Когда они говорят о продуктах, которые они покупают, я подозреваю, что вы будете придерживаться атрибутов продукта и цен.

Некоторые возможные подходы. Если вы, пользователи, вводите нечисловые данные (например, цвета), просто запишите наиболее распространенные записи или режим (наиболее часто вводимый).

Если они вводят числовые данные, отбрасывают выбросы. т.е. самые низкие и самые высокие результаты и усреднение остальных (скажем, вы могли бы сделать это для цен, скажем. Такой подход используют электронные биржи для разрешения цен закрытия из многих сделок).

В зависимости от вашего приложения вы можете иметь исторический уклон к самым последним записям.

Но все это зависит от вашего приложения, а также от объема хранилища и обработки данных, которые вы готовы сделать.

1 голос
/ 24 апреля 2009

Убедитесь, что вы ведете журнал IP-адресов с каждым выполненным действием, злоумышленники или боты будут попирать данные сессии или куки. Это гарантирует, что один объект не сможет исказить результаты или сделать что-либо радикальное, представившись несколькими пользователями.

0 голосов
/ 25 ноября 2009

Как данные высокого уровня могут быть собраны из «толпы» с соответствующим значением корректности. Глядя на SO, ответ или ответ от кого-то с 1000+ повторениями, имеет больше смысла, чем случайный пользователь. Ищите валидации и триангуляцию, если вы тоже слушаете один голос в толпе, то, вероятно, это не стоит того. Если другие голоса присоединяются, то вы знаете, что вы на что-то, опять же, с точки зрения SO, у всех нас есть шанс поднять вопросы.

Недавно я видел несколько действительно хороших приложений для iPhone, которые полагаются на краудсорсинг для своих данных, а затем проверяют его, спрашивая других пользователей, правильно ли это.

...