Question

Я собираюсь сделать классификацию текста впервые с Наивным Байесом.Этот код, который я нашел на http://scikit -learn.org / stable / tutorial / text_analytics / working_with_text_data.html :

>>> from sklearn.naive_bayes import MultinomialNB
>>> clf = MultinomialNB().fit(X_train_tfidf, twenty_train.target)

Я хочу разрешить одно сомнение относительно параметров X_train_tfidf, twenty_train.target передано функции fit ().

X_train_tfidf - это векторное представление tfidf всех документов в наборе поездов.

fifty_train.target - соответствующие метки документов в точном порядке , как они появляются в наборе X_train_tfidf.

Я прав?

Fabio Picchi · Answer 1 · 25 сентября 2018

Краткий ответ: Да

Длинный ответ: Это верно для каждого метода fit , который вы найдете с помощью API.Учитывая матрицу документов X с размерами [m, n], целевой вектор Y будет иметь размерность [n, 1] и документ X[:, j] соответствует цели Y [j] для каждого j от 0 до n-1 .

Если документы и цели не совпадают, вы, вероятно, получите очень плохой и необоснованный результат в процессе обучения.

Классификация текстов + Наивный байесовский + Scikit Learn

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Классификация текстов + Наивный байесовский + Scikit Learn

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы