Я пытаюсь разделить .csv на 2 списка, один - данные тренировки, а другой - данные теста. У меня есть условие, что если данные имеют 36 столбцов (завершено), это данные обучения. В противном случае это тестовые данные, в последнем столбце отсутствует, что я и сделал предсказания для - зависимой переменной
Я написал:
def training_test_split(self, data):
train_list=[]
test_list=[]
for i in data:
if len(i[0])==36: #I mean if the number of columns in the ith row = 36
train_list.append(data)
else:
test_list.append(data)
return [train_list, test_list]
Таким образом, я поместил одну строку данных как заполнение условия для test_list, а остальные заполнили условие для train_list. Но все они входят в train_list, когда я вызываю эту функцию: /
Я не хочу использовать панд. Сожалею. Любое понимание будет оценено!
Может быть, мне нужно сделать это, если в 36-м столбце есть «ЗНАЧЕНИЕ», тогда бла. Это зазубренный набор данных ... Не уверен.