Разработайте наивный байесовский классификатор в качестве фильтра электронной почты в Python без библиотеки машинного обучения - PullRequest
0 голосов
/ 17 февраля 2020

У меня есть набор данных ("wordsList.csv" и "classList.csv")

файл wordsList содержит 72 предварительно обработанных электронных письма. Каждая строка представляет собой список слов, извлеченных из каждого письма.

Файл classList содержит метки классов, указывающие, являются ли электронные письма обычными или рекламными (0 для обычных и 1 для рекламных объявлений).

Моя задача - разработать наивный байесовский классификатор в качестве электронного письма фильтр Python. А именно, классификатор предсказывает, являются ли электронные письма обычными или рекламными.

Наивный байесовский классификатор должен учитывать множественные вхождения слов и реализует методы для преодоления числовых недостатков и нулевого счета.

Но плохо новость в том, что я не могу использовать какую-либо библиотеку машинного обучения, разрешены только sciPy и NumPy, есть ли способ реализовать это? И если да, то есть ли пример кода, который реализует этот метод с нуля? Заранее спасибо!

wordsList table classList table

...