Я пишу некоторый скрипт на python, который открывает файл .csv, определяет фрейм данных, запускает некоторый анализ (например, агрегирует данные, разбивает столбцы, находит средние значения и т. Д.) И отображает результаты анализа на графике. Выходными данными будут как график (файл .png), так и файл csv со словом «_ANALYSIS», добавленным к исходному имени файла в конце.
В Jupyter Notebook я настроил это как функцию цикла:
#import multiple csv files
import glob
import pandas as pd
import numpy as np
from pytz import all_timezones
import matplotlib.pyplot as plt
files = glob.glob('folder/*.csv')
for file in files:
df = pd.read_csv(file)
#START OF THE ANALYSIS
#Multiple lines of code starts here
#GRAPH some outputs from the analysis
df2 = df.replace(0, np.nan)
fig, ax = plt.subplots()
df2.groupby('Day_type').plot(x = 'Time', y = 'avg_vt', ax=ax, grid=True)
#OUTPUT FILES: graph + csv file
plt.savefig('*.png', index = False)
file_name="file"+str(i+1)+"_ANALYSIS"
df.to_csv('file1_ANALYSIS.csv', index = False)
К сожалению, он не производит никаких выходных данных. Нет проблем с самим кодом анализа, так как я пробовал его до добавления функции цикла.
Спасибо,
R