Отображение слишком большого количества «скинов» в программном обеспечении - PullRequest
31 голосов
/ 04 ноября 2008

Я создаю веб-сайт ASP.NET, где пользователи могут загружать свои фотографии. Там могут быть загружены тысячи фотографий каждый день. Одна вещь, которую мой босс несколько раз спрашивал, есть ли какой-нибудь способ, которым мы могли бы обнаружить, если какая-либо из фотографий показывает слишком много «обложек», и автоматически переместить их как «Только для взрослых», прежде чем редакторы примут окончательное решение.

Ответы [ 14 ]

1 голос
/ 05 ноября 2008

Возможно Porn Breath Test будет полезно -., Как сообщалось на Slashdot

0 голосов
/ 07 июля 2012

Как упоминалось выше Биллом (и цитатой Крейга в Google), статистические методы могут быть очень эффективными.

Два подхода, которые вы могли бы рассмотреть:

  • Нейронные сети
  • Многофакторный анализ (MVA)

Подход MVA будет заключаться в получении «репрезентативной выборки» приемлемых изображений и неприемлемых изображений. Данные X будут массивом байтов из каждого изображения, Y будет назначен вами как 1 для неприемлемого и 0 для приемлемого. Создайте модель PLS, используя эти данные. Запустите новые данные для модели и посмотрите, насколько хорошо она предсказывает Y.

Вместо этого бинарного подхода вы могли иметь несколько Y-х (например, 0 = приемлемо, 1 = купальник / нижнее белье, 2 = порнографического)

Чтобы построить модель, вы можете обратиться к программному обеспечению с открытым исходным кодом или есть ряд коммерческих пакетов (хотя они обычно недешевы)

Поскольку даже самые лучшие статистические подходы не являются совершенными, идея включения обратной связи с пользователями, вероятно, будет хорошей идеей.

Удачи (и в худшем случае вы тратите время на сбор непослушных картинок как одобренное и платное занятие!)

0 голосов
/ 07 ноября 2008

CrowdSifter от Dolores Labs может помочь вам. Я все время читаю их блог, так как они, кажется, любят статистику и краудсорсинг и любят говорить об этом. Они используют механический турник Amazon для большой части своей обработки и знают, как обрабатывать результаты, чтобы получить правильные ответы из вещей. Посмотрите их блог по крайней мере, чтобы увидеть некоторые интересные статистические эксперименты.

0 голосов
/ 05 ноября 2008

Боюсь, я не могу помочь направить вас в правильном направлении, но я помню, как читал об этом, что было сделано раньше. Это было в контексте людей, жалующихся на то, что детские картинки были пойманы и ошибочно помечены Если ничего другого, я могу дать вам надежду, что вам не придется изобретать колесо самостоятельно ... Кто-то еще был на этом пути!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...