Я пытаюсь создать приложение для обнаружения изображений, которые являются рекламой с веб-страниц. Как только я обнаружу их, я не позволю отображать их на стороне клиента.
Из справки, которую я получил по этому вопросу Stackoverflow , я подумал, что SVM - лучший подход к моей цели.
Итак, я сам кодировал SVM и SMO. Набор данных, который я получил из хранилища данных UCI, имеет 3280 экземпляров ( Ссылка на набор данных ), из которых около 400 относятся к классу, представляющему рекламные изображения, а остальные представляют не рекламные изображения.
Прямо сейчас я беру первые 2800 входных наборов и обучаю SVM. Но, посмотрев на коэффициент точности, я понял, что большинство из этих 2800 входных наборов относятся к классу изображений без рекламы. Так что я получаю очень хорошую точность для этого класса.
Так что я могу сделать здесь? О том, сколько входных данных я должен дать SVM для обучения и сколько их для каждого класса?
Спасибо. Приветствия. (По сути, задан новый вопрос, поскольку контекст отличается от моего предыдущего вопроса. Оптимизация входных данных нейронной сети )
Спасибо за ответ.
Я хочу проверить, правильно ли я получаю значения C для объявлений и неклассного класса.
Пожалуйста, дайте мне отзыв об этом.
Или вы можете увидеть версию документа здесь .
Вы можете увидеть график от y1 до y2 здесь
и y1 здесь не равно y2