Я загружаю файл CSV в фрейм данных Pandas для проекта машинного обучения.У меня 16 колонок.«Метка» или «цель» - это последний столбец.Остальные переменные.Мне нужно определить первые 15 столбцов как объекты, а 16-й - как цель.
Кажется, что все примеры, которые я нахожу, демонстрируют машинное обучение на наборе, который уже определил их.Как я могу определить свою «цель» сам?
import pandas as pd
import numpy as np
import sklearn
from sklearn.model_selection import train_test_split
lymph = pd.read_csv("D:\\dataset_10_lymph.csv", encoding="utf-8", header = 0)
array = lymph.values
data = array[:,0:-1]
target = array[:,-1]
X_train, X_test, y_train, y_test = train_test_split(lymph.data, lymph.target, stratify=lymph.target, random_state=66)
Но когда я пытаюсь проверить, что мой целевой массив сгенерирован правильно, я получаю трассировку.
AttributeError: у объекта «DataFrame» нет атрибута «data»
Похоже, что это будет тривиальный шаг, который нужно сделать, если они не используют набор данных sklearn для практики.Любая помощь будет оценена.Спасибо.