Спасибо за помощь, Флориан, я исправил это зацикливание в моем каталоге, как вы сказали.
Однако мне не удалось зациклить словарь, так как он не хэш.
Я опубликую свой код ниже на случай, если у кого-то еще возникнет та же проблема, что и у меня.
#Where to look
os.chdir(r"C:\relevant\directory")
cwd = os.getcwd()
#key variables
master_df = pd.DataFrame()
#Data clean up function
def get_key_info(x):
salary_str = get_data["Employee"].iloc[2]
pay_after_tax_str = get_data["Tax Period"].iloc[14]
date_format = get_data["Pay Date"].iloc[0]
salary = int(float(salary_str[1:].replace(",", "")))
pay = int(float(pay_after_tax_str[1:].replace(",", "")))
deductions = (salary - pay)
df = pd.DataFrame([
[date_format, salary, pay, deductions]
],
columns=["Payment date", "Salary before tax", "take home pay", "total deductions"])
return df
#Iterate over files
for f in os.listdir():
get_data = read_pdf(f)
master_df = master_df.append(get_key_info(f), ignore_index = True)
print(master_df)
Здесь я установил переменную get_data
для изменения каждой итерации цикла for, которая затем.append()
the master_df