Как представить данные из панд? - PullRequest
0 голосов
/ 17 сентября 2018
for excel_file in os.listdir(file_path):
    file_name = os.path.splitext(os.path.basename(excel_file))[0] 
    df = pd.read_csv(file_path + "\\" + excel_file, header = 0, index_col =  False, low_memory = False) 
    results_file.write("Results for file %s" % file_name)
    results_file.write("\n")
    results_file.write("Number of total entries: %d" % df.shape[0])
    results_file.write("\n\n")

    for column in df:
        counts = (df[column].value_counts())
        counts = str(counts)
        results_file.write(counts)

Это проходит через все мои файлы дампа в данном каталоге и возвращает число раз, когда каждое уникальное значение встречается в данном столбце.Что мне нужно сделать, это поместить это в таблицу, в которой первый столбец содержит имя столбца из серии, за которым следует уникальное значение, а второй столбец - количество вхождений этого значения.Таблица Панд приблизила меня, но форматирование было шатким, и я не мог понять, как его обработать для каждого столбца и файла.Также необходимо добавить третий столбец в таблицу, который указывает, является ли количество вхождений менее 10 процентов от всех вхождений.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...