Python: разделение тестовых и обучающих данных с помощью оператора if - PullRequest
0 голосов
/ 05 сентября 2018

Я пытаюсь разделить .csv на 2 списка, один - данные тренировки, а другой - данные теста. У меня есть условие, что если данные имеют 36 столбцов (завершено), это данные обучения. В противном случае это тестовые данные, в последнем столбце отсутствует, что я и сделал предсказания для - зависимой переменной

Я написал:

def training_test_split(self, data):
   train_list=[]
   test_list=[]
   for i in data:
       if len(i[0])==36: #I mean if the number of columns in the ith row = 36
          train_list.append(data)
       else:
          test_list.append(data)
   return [train_list, test_list]

Таким образом, я поместил одну строку данных как заполнение условия для test_list, а остальные заполнили условие для train_list. Но все они входят в train_list, когда я вызываю эту функцию: / Я не хочу использовать панд. Сожалею. Любое понимание будет оценено!

Может быть, мне нужно сделать это, если в 36-м столбце есть «ЗНАЧЕНИЕ», тогда бла. Это зазубренный набор данных ... Не уверен.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...