Я пытаюсь настроить test_train_split
с данными, которые я прочитал из csv в кадр данных pandas. Книга, которую я читаю, говорит, что я должен разделить на x_train
как данные и y_train
как цель, но как я могу определить, какой столбец является целью, а какие столбцы являются данными? Пока у меня есть следующее
import pandas as pd
from sklearn.model_selection import train_test_split
Data = pd.read_csv("Data.csv")
Я прочитал, чтобы выполнить разбиение следующим образом, однако следующее использовало связку, где data
и target
уже были определены:
X_train, X_test, y_train, y_test = train_test_split(businessleisure_data['data'],
iris_dataset['target'], random_state=0)