У меня есть CSV-файл с данными обо всех футбольных матчах Премьер-лиги в сезоне 17/18.Я хочу написать цикл, который разбивает эти данные на наборы тестов и поездов.Первый набор тестовых данных будет включать все данные первых 10 раундов матча.В следующий набор тестовых данных будут включены все данные из первых 11 раундов и т. Д. И т. Д. В основном, наборы тестовых данных будут увеличиваться в каждом раунде матчей вместе с матчами последнего раунда.Всего 38 игровых раундов.
CSV-файл выглядит следующим образом: 
Я написал следующий код:
import pandas as pd
def build_temp_model(dataset, match_round):
test_dataset = dataset[dataset['Round'] <= match_round]
if len(test_dataset) == 0:
return 0
file_name = str(match_round) + '.csv'
train_dataset.to_csv(file_name, index=None)
EPL = pd.DataFrame()
EPL = pd.read_csv('/Users/HJA/Desktop/Betting/understatV0.01/test.csv')
EPL = EPL.sort_values(by='Round')
if __name__ == '__main__':
get_total_score = [build_temp_model(EPL, round) for rounds in range(11, 39, 1)]
Однако я получаюошибка в следующей строке:
test_dataset = dataset[dataset['Round'] <= match_round]
Ошибка говорит: TypeError: '<=' не поддерживается между экземплярами 'int' и 'builtin_function_or_method' </em>
Canкто нибудь объясните пожалуйста что я делаю не так?Заранее спасибо,