Подготовка обучающих наборов данных - PullRequest
0 голосов
/ 13 мая 2019

При подготовке набора обучающих данных нужно ли удалять целевые переменные данные из набора обучающих данных или можно оставить его?Итак, должен ли X = df[:,:] в приведенном ниже коде исключать целевую переменную или имеет значение?

# Feature to be predicted (y)
y = df['predicted'] #target variable

#Training data
X = df[:,:]

# Perform a 70% train and 30% test data split
X_train, X_test, y_train, y_test = ____(X, y, ____=____)

Ответы [ 2 ]

1 голос
/ 13 мая 2019

Уход или не выход из цели зависит от используемой вами библиотеки машинного обучения. При создании набора обучающих данных некоторые библиотеки дают вам возможность указать, какие столбцы использовать для обучения. В случае этих библиотек вам не нужно ничего удалять из обучающих данных.

Sklearn не имеет этой опции, поэтому вам придется отказаться от целевой функции.

# Feature to be predicted (y)
y = df['predicted'] #target variable

#Training data
X = df.drop("predicted",1)
# here 1 is the axis which means drop a column

# Perform a 70% train and 30% test data split
X_train, X_test, y_train, y_test = ____(X, y, ____=____)
0 голосов
/ 13 мая 2019

Вы не можете оставить метку в наборе функций, вы бы пропустили готовый ответ.

X = df.drop(columns = 'predicted')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...