Как представить данные электронной почты в качестве входных данных для классификации на основе темы обсуждения с помощью Weka? - PullRequest
0 голосов
/ 05 января 2012

Дубликат: Как представить текст для классификации в weka?

Что будет входом для классификатора, если мои данные будут электронной почтой, то есть текстовыми данными?Каковы будут атрибуты / набор функций в электронной почте, которые мне необходимо учитывать для выполнения классификации на основе темы обсуждения?

1 Ответ

0 голосов
/ 01 марта 2012

Обычно входные данные преобразуются с использованием TF-IDF в разреженные векторы.

...