Классификация текстов + Наивный байесовский + Scikit Learn - PullRequest
0 голосов
/ 25 сентября 2018

Я собираюсь сделать классификацию текста впервые с Наивным Байесом.Этот код, который я нашел на http://scikit -learn.org / stable / tutorial / text_analytics / working_with_text_data.html :

>>> from sklearn.naive_bayes import MultinomialNB
>>> clf = MultinomialNB().fit(X_train_tfidf, twenty_train.target)

Я хочу разрешить одно сомнение относительно параметров X_train_tfidf, twenty_train.target передано функции fit ().

X_train_tfidf - это векторное представление tfidf всех документов в наборе поездов.

fifty_train.target - соответствующие метки документов в точном порядке , как они появляются в наборе X_train_tfidf.

Я прав?

1 Ответ

0 голосов
/ 25 сентября 2018

Краткий ответ: Да

Длинный ответ: Это верно для каждого метода fit , который вы найдете с помощью API.Учитывая матрицу документов X с размерами [m, n], целевой вектор Y будет иметь размерность [n, 1] и документ X[:, j] соответствует цели Y [j] для каждого j от 0 до n-1 .

Если документы и цели не совпадают, вы, вероятно, получите очень плохой и необоснованный результат в процессе обучения.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...