У меня большой набор данных (df) (8M строк, 50 столбцов). Я пытаюсь построить для l oop, чтобы создать файл Excel, где каждый лист содержит значение value_counts () каждого из столбцов набора данных.
(т.е. на рабочем листе ('Sheet1') я пишу df.columns [0] .value_counts (), а на рабочем листе ('Sheet2') я пишу df.columns [1] .value_counts () et c et c).
Вот что я попробовал:
for i in range(3,6): # I am using a small range to test the loop
z = df1[df1.columns[i]].value_counts()
z = z.to_frame().reset_index()
title = str(i)
with pd.ExcelWriter('Pivot part1.xlsx') as writer:
z.to_excel(writer, sheet_name=title)
Это продолжает перезаписывать файл, так что я получил файл Excel с одним листом, а не с файлом Excel. с 4 листами.
Я надеюсь, что мне удалось четко объяснить проблему, и я прошу прощения, если этот вопрос является дубликатом, но я не смог найти подходящий ответ или хотя бы один, который я мог бы понять.