Какие данные вы собираете?
Вы говорите о краудсорсинге и, таким образом, (я полагаю) агрегации данных в этой толпе. Когда они говорят о продуктах, которые они покупают, я подозреваю, что вы будете придерживаться атрибутов продукта и цен.
Некоторые возможные подходы. Если вы, пользователи, вводите нечисловые данные (например, цвета), просто запишите наиболее распространенные записи или режим (наиболее часто вводимый).
Если они вводят числовые данные, отбрасывают выбросы. т.е. самые низкие и самые высокие результаты и усреднение остальных (скажем, вы могли бы сделать это для цен, скажем. Такой подход используют электронные биржи для разрешения цен закрытия из многих сделок).
В зависимости от вашего приложения вы можете иметь исторический уклон к самым последним записям.
Но все это зависит от вашего приложения, а также от объема хранилища и обработки данных, которые вы готовы сделать.