В настоящее время я работаю над системой рекомендаций по видео, которая будет предсказывать видео в форме 0 (отрицательный) и 1 (положительный). Я успешно очищаю набор данных с YouTube, а также нахожу чувства комментариев YouTube в виде 0 (отрицательный) и 1 (положительный). Я кодирую текстовые данные моего CSV, используя один горячий кодировщик, и получаю вывод в виде массива numpy , Теперь у меня вопрос, как дать массив numpy в качестве входа (X) в регрессии logisti c? Ниже приведены мой код, выходные данные и CSV (1874 X 2).
Целевая переменная Comments_Sentiments
#OneHotEncoding
import numpy as np
import pandas as pd
from sklearn import preprocessing
X = pd.read_csv("C:/Users/Shahnawaz Irfan/Desktop/USIrancrisis/demo.csv")
#X.head(5)
X = X.select_dtypes(include=[object])
#X.head(5)
#X.shape
#X.columns
le = preprocessing.LabelEncoder()
X_2 = X.apply(le.fit_transform)
X_2.head()
enc = preprocessing.OneHotEncoder()
enc.fit(X_2)
onehotlabels = enc.transform(X_2).toarray()
onehotlabels.shape
onehotlabels
Вывод:
array([[1.],
[1.],
[1.],
...,
[1.],
[1.],
[1.]])
Может ли кто-нибудь разрешить этот запрос, взяв этот массив numpy в качестве входа в logisti c регрессия?