Я оцениваю данные игры: Old School Runescape (OSRS), я записываю эти необработанные данные в свой github (ежедневный файл) (данные имеют интервал 30 минут, если они продаются (покупаются или продаются)). Я хочу использовать эти данные для прогнозирования временных рядов.
У меня есть записная книжка Python, которая собирает эти необработанные данные, немного их очищает и сохраняет в виде файла .pkl.
У меня есть еще одна записная книжка на python, в которой функции основаны на этом файле .pkl.
И 2 pythonзаписные книжки, в которых я пытаюсь работать с AI.
Мои вопросы:
- Это хороший процесс объединения и очистки необработанных данных? (если нет, как я могу улучшить)
- Каков наилучший формат для использования / хранения данных для последующего использования в tenorflow
- Должен ли я хранить данные сейчас в этом формате или когда я добавляю функции