найти 1 драгоценный камень в 1000 с нейронной сетью? что-то другое? - PullRequest
2 голосов
/ 25 февраля 2012

Что-то я не понимаю в нейронных сетях. Я пытался использовать их для анализа финансовых данных и классификации звукового поля. В обоих случаях мне нужен классификатор, который может обнаружить значимый элемент среди многих. Мое аудио приложение буквально имеет один положительный хит на каждую тысячу отрицательных хитов Я управляю сетевым тренером, и он узнает, что это чертовски хорошее предположение, чтобы просто пойти с негативом. Есть ли какой-то другой алгоритм для обнаружения редкого камня? Существует ли какая-либо форма обучения нейронной сети, которая особенно подходит для такого типа проблем? Я могу изменить диапазон моих положительных данных, чтобы он был эквивалентен сумме отрицательных значений, но я не понимаю, как это соответствует предпочтительному диапазону от нуля до единицы в типичной нейронной сети.

1 Ответ

1 голос
/ 25 февраля 2012

Вот два возможных предложения:

  1. Баланс вашего тренировочного набора

    Даже если реальные данные содержат в 1000 раз больше негативов, чемПоложительные, ваши данные тренировки не должны.Вы можете изменить свой тренировочный набор данных, чтобы увеличить долю положительных результатов в тренировочном наборе.Это улучшит отзыв (больше истинных положительных результатов), но также ухудшит точность (также больше ложных срабатываний).Итак, вам придется поэкспериментировать с идеальным соотношением положительных и отрицательных значений в обучающем наборе.

    В этом документе этот подход рассматривается более подробно: http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2243711/pdf/procamiasymp00003-0260.pdf

  2. Обнаружение аномалий

    ... с другой стороны, если у вас слишком мало положительных примеров для обучения нейронной сети с более сбалансированным обучающим набором, то, возможно, вы можете попробовать обнаружение аномалий .При обнаружении аномалий вы обучаете свой алгоритм (например, нейронную сеть) распознавать, как выглядят отрицательные точки данных.Затем любая точка данных, которая выглядит иначе, чем обычно, помечается как положительная.

...