Как упоминалось выше Биллом (и цитатой Крейга в Google), статистические методы могут быть очень эффективными.
Два подхода, которые вы могли бы рассмотреть:
- Нейронные сети
- Многофакторный анализ (MVA)
Подход MVA будет заключаться в получении «репрезентативной выборки» приемлемых изображений и неприемлемых изображений. Данные X будут массивом байтов из каждого изображения, Y будет назначен вами как 1 для неприемлемого и 0 для приемлемого. Создайте модель PLS, используя эти данные. Запустите новые данные для модели и посмотрите, насколько хорошо она предсказывает Y.
Вместо этого бинарного подхода вы могли иметь несколько Y-х (например, 0 = приемлемо, 1 = купальник / нижнее белье, 2 = порнографического)
Чтобы построить модель, вы можете обратиться к программному обеспечению с открытым исходным кодом или есть ряд коммерческих пакетов (хотя они обычно недешевы)
Поскольку даже самые лучшие статистические подходы не являются совершенными, идея включения обратной связи с пользователями, вероятно, будет хорошей идеей.
Удачи (и в худшем случае вы тратите время на сбор непослушных картинок как одобренное и платное занятие!)