сентиментальный анализ только для одного обзора .. вот код, который должен быть вторым аргументом для classifier.fit (new_X_test,)? - PullRequest
0 голосов
/ 10 июля 2020

это код для сентиментального анализа только для одного обзора, поскольку у нас нет набора данных, я не могу понять, какой будет второй параметр для метода classifier.fit в наивной байесовской модели?

# Importing the libraries
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

# Cleaning the code
import re   
import nltk    
nltk.download('stopwords') 
from nltk.corpus import stopwords 
from nltk.stem.porter import PorterStemmer 
new_review = 'I love this restaurant so much'
new_review = re.sub('[^a-zA-Z]', ' ', new_review)
new_review = new_review.lower()
new_review = new_review.split()
ps = PorterStemmer()
all_stopwords = stopwords.words('english')
all_stopwords.remove('not')
new_review = [ps.stem(word) for word in new_review if not word in set(all_stopwords)]
new_review = ' '.join(new_review)
new_corpus = [new_review]


#Creating the bag of word model
from sklearn.feature_extraction.text import CountVectorizer
cv = CountVectorizer(3)
new_X_test = cv.fit_transform(new_corpus).toarray()
#new_X_test = cv.transform(new_corpus).toarray()

# training in Naive bayes model

from sklearn.naive_bayes import GaussianNB
classifier = GaussianNB()
classifier.fit(new_X_test, )

# predict the result
#y_pred = classifier.predict(X)
new_y_pred = classifier.predict(new_X_test)
print(new_y_pred)

#new_X_test = cv.transform(new_corpus).toarray()
#new_y_pred = classifier.predict(X)
#print(new_y_pred)

1 Ответ

0 голосов
/ 10 июля 2020

Согласно sklearn.naive_bayes.GaussianNB.fit () странице руководства, второй параметр - y, где:

y: форма в виде массива (n_samples,) Целевые значения.

Целевое значение в вашем случае - это тональность вашего уникального отзыва. Наивный Байесовский алгоритм классификации с учителем. "Под наблюдением" означает, что вы должны управлять алгоритмом во время обучения (или подбора модели), предоставляя правильные целевые значения (или метки).

Код в его нынешнем виде не имеет особого смысла. Вы не можете осмысленно обучить / подогнать модель только на одном образце. Вам понадобится набор данных с множеством обзоров, чтобы соответствовать модели, а затем попытаться предсказать новые образцы.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...