Анализ текста для неструктурированных данных - PullRequest
0 голосов
/ 07 марта 2019

У меня есть вопрос у меня есть большое количество неструктурированных текстовых данных, которые я хочу классифицировать по различным секторам.

я использую для него наивный байесовский классификатор

Теперь, мой вопрос, что я должен передать в Y ?? потому что у меня нет целевых значений

и согласно синтаксису я должен передать его.

mnb = MultinomialNB()

mnb.fit(X,y)

TypeError: fit() missing 1 required positional argument: 'y'

Как я уже сказал, у меня нет целевого значения.

Как я могу это сделать?

Помощь будет оценена

1 Ответ

0 голосов
/ 07 марта 2019

Наивный байесовский классификатор является контролируемым методом обучения и требует от вас обучения его с использованием помеченных данных, в которых вы заранее знаете цели.Затем вы можете использовать его на немаркированных данных для прогнозирования будущих значений, но вы не можете обучить его на данных без целевых значений.

Трудно рекомендовать другой метод, не зная больше о вашей задаче, но это звучит как выхочу посмотреть на алгоритмы кластеризации без присмотра.k-means - это относительно простой для начала.

...