Поиск входных параметров нейронной сети для классификации текстовых документов - PullRequest
2 голосов
/ 18 ноября 2011

Мне нужно обучить нейронную сеть для классификации некоторых текстовых документов в логический класс (NN имеет один выход со значениями «Да» или «Нет»).
Существует ли какой-либо алгоритм для поиска наилучших входных параметров (например, наличие слов, термин, предложение и / или частота / повторение слова & ...)?
Если нет, можете ли вы дать мне отправную точку, чтобы найти эти параметры (Как мне выбрать их)?

Спасибо

1 Ответ

1 голос
/ 05 января 2012

Стандартный подход, который я знаю, состоит в том, чтобы использовать вектор слов / терминов и присваивать им отрицательный или положительный балл, используя алгоритм обучения или статистический алгоритм.даже обучения перцептрону должно хватить, вам просто нужен хороший набор положительных и отрицательных примеров.

Насколько мне известно, так работает весь спам-фильтр.и они работают довольно хорошо.

...