Объектно-ориентированная байесовская фильтрация спама? - PullRequest
26 голосов
/ 04 августа 2008

Мне было интересно, есть ли какая-нибудь хорошая и чистая реализация объектно-ориентированного программирования (ООП) байесовской фильтрации для классификации спама и текста? Это только для учебных целей.

Ответы [ 6 ]

12 голосов
/ 03 сентября 2008

Я определенно рекомендую Weka , которая является открытым программным обеспечением для интеллектуального анализа данных , написанным на Java:

Weka - это набор алгоритмов машинного обучения для задач интеллектуального анализа данных. Алгоритмы могут быть применены непосредственно к набору данных или вызваны из вашего собственного кода Java. Weka содержит инструменты для предварительной обработки данных, классификации, регрессии, кластеризации, правил ассоциации и визуализации. Он также хорошо подходит для разработки новых схем машинного обучения.

Как упоминалось выше, он поставляется с кучей различных классификаторов, таких как SVM , Winnow , C4.5 , Наивный байесовский (конечно) и многие другие. подробнее (см. API документ ). Обратите внимание, что многие классификаторы, как известно, имеют намного лучшую производительность, чем Наивный Байес в области обнаружения спама или классификации текста.

Кроме того, Weka предлагает вам очень мощный графический интерфейс

5 голосов
/ 01 сентября 2008
5 голосов
/ 04 августа 2008

Может быть https://ci -bayes.dev.java.net / или http://www.cs.cmu.edu/~javabayes/Home/node2.html?

Я тоже никогда не играл с ним.

3 голосов
/ 04 августа 2008

Вот реализация байесовской фильтрации в C #: Наивный байесовский фильтр спама для C # (размещен на CodeProject).

2 голосов
/ 08 мая 2009

nBayes - еще одна реализация C #, размещенная на CodePlex

1 голос
/ 04 августа 2008

На французском, но вы должны быть в состоянии найти ссылку для скачивания :) PHP наивный байесовский фильтр

...