Создание нового кадра данных с циклом - PullRequest
0 голосов
/ 21 октября 2018

У меня есть CSV-файл с данными обо всех футбольных матчах Премьер-лиги в сезоне 17/18.Я хочу написать цикл, который разбивает эти данные на наборы тестов и поездов.Первый набор тестовых данных будет включать все данные первых 10 раундов матча.В следующий набор тестовых данных будут включены все данные из первых 11 раундов и т. Д. И т. Д. В основном, наборы тестовых данных будут увеличиваться в каждом раунде матчей вместе с матчами последнего раунда.Всего 38 игровых раундов.

CSV-файл выглядит следующим образом: enter image description here

Я написал следующий код:

import pandas as pd

def build_temp_model(dataset, match_round):
   test_dataset = dataset[dataset['Round'] <= match_round]
   if len(test_dataset) == 0:
      return 0
   file_name = str(match_round) + '.csv'
   train_dataset.to_csv(file_name, index=None)

EPL = pd.DataFrame()
EPL = pd.read_csv('/Users/HJA/Desktop/Betting/understatV0.01/test.csv')
EPL = EPL.sort_values(by='Round')

if __name__ == '__main__':
    get_total_score = [build_temp_model(EPL, round) for rounds in range(11, 39, 1)]

Однако я получаюошибка в следующей строке:

test_dataset = dataset[dataset['Round'] <= match_round]

Ошибка говорит: TypeError: '<=' не поддерживается между экземплярами 'int' и 'builtin_function_or_method' </em>

Canкто нибудь объясните пожалуйста что я делаю не так?Заранее спасибо,

1 Ответ

0 голосов
/ 21 октября 2018

Опечатка. Pylint помог бы.

get_total_score = [build_temp_model(EPL, round) for rounds in range(11, 39, 1)]

round() - встроенная функция.rounds - это переменная, с которой вы перебираете.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...