for excel_file in os.listdir(file_path):
file_name = os.path.splitext(os.path.basename(excel_file))[0]
df = pd.read_csv(file_path + "\\" + excel_file, header = 0, index_col = False, low_memory = False)
results_file.write("Results for file %s" % file_name)
results_file.write("\n")
results_file.write("Number of total entries: %d" % df.shape[0])
results_file.write("\n\n")
for column in df:
counts = (df[column].value_counts())
counts = str(counts)
results_file.write(counts)
Это проходит через все мои файлы дампа в данном каталоге и возвращает число раз, когда каждое уникальное значение встречается в данном столбце.Что мне нужно сделать, это поместить это в таблицу, в которой первый столбец содержит имя столбца из серии, за которым следует уникальное значение, а второй столбец - количество вхождений этого значения.Таблица Панд приблизила меня, но форматирование было шатким, и я не мог понять, как его обработать для каждого столбца и файла.Также необходимо добавить третий столбец в таблицу, который указывает, является ли количество вхождений менее 10 процентов от всех вхождений.