Обучаемый классификатор / модель машинного обучения спаму - PullRequest
0 голосов
/ 16 июля 2010

У меня есть список предложений около 17 миллионов.Мне нужно идентифицировать предложение как спам / ветчина / неуверенный.Существуют ли в Интернете обученные модели, в которые я мог бы просто ввести свои данные в качестве «тестового» набора, и система классифицировала бы мое предложение как спам / хам?

Примечание :предложения не являются электронными письмами.

1 Ответ

0 голосов
/ 16 февраля 2011

Вы можете использовать байесовскую фильтрацию спама, взгляните на эту статью, довольно приятно понять теорию http://robotics.stanford.edu/users/sahami/papers-dir/spam.pdf

...