Я пытаюсь взять этот набор данных и прогнозировать уровни популярности новостей с течением времени.
Набор данных состоит из 145 столбцов (1 - это идентификатор, связанный с фактической новостью вотдельный файл, 2 - 145 для 144 20-минутных временных интервалов, где каждая ячейка подряд записывает уровень популярности соответствующей новости).
Я уже нормализовал набор данных "Facebook_Economy.csv", чтобы его диапазонот 0 до 1. В настоящее время я могу кормить только одну временную серию, установленную в моей модели (поезд ~ 100 временных интервалов и тестирование ~ 44 временных интервалов).Моя цель состоит в том, чтобы взять несколько рядов из 144 временных интервалов для обучения и тестирования в нескольких других рядах, например, взять данные временных рядов для новостных сюжетов 1-20 и обучиться новостным сюжетам 21-30 и т. Д.
Вот как я в настоящее время подаю данные в свою модель:
def run(filename):
series = read_csv(filename, header=0, index_col=0)
repeats = 1
results = DataFrame()
timesteps = 1
for i in range(len(series)):
results['results'] = experiment(repeats, series.iloc[i].squeeze(), timesteps)
# Where experiment(repeats, series, timesteps)
print(results.describe())
Также (для некоторого понимания того, как выглядит остальная часть моего кода) я следовал этому учебнику изДжейсону Браунли за руководство.