Как получить среднее значение столбца во многих CSV-папках в пандах? - PullRequest
1 голос
/ 07 октября 2019

У меня есть папка csv со многими файлами. Каждый CSV-файл выглядит следующим образом

CSV 1

   Name   Sales
 0 Sam    250
 0 Steve  554
 0 Ann    244 

CSV 2

   Name   Sales
 0 Sam    250
 0 Steve  554
 0 Ann    244 

Есть ли способ получить среднее значение продаж для каждого CSV

Ищу это

   sale mean 
0  349.333333
1  349.333333

Ответы [ 2 ]

1 голос
/ 07 октября 2019

Прочитайте ваш файл в pandas, используйте функцию .mean() для добавления среднего столбца и сохраните файл обратно в CSV:

import pandas as pd

# read your file
df = pd.read_csv("csv1.csv", sep="\t", header=1)
df["sale_mean"] = df.sale.mean()

# write it back
df.to_csv("csv1_altered.csv", header=true, index=False) 

Надеюсь, это поможет.

0 голосов
/ 07 октября 2019

Предполагая, что ваши csv файлы имеют запятую как seperator, следующий код должен работать обобщенно:

import os

folder = r'home\desktop\path_to_csvfiles'

means = []
for file in os.listdir(folder):
    df = pd.read_csv(os.path.join(folder, file))
    means.append(df['Sales'].mean())

df_final = pd.DataFrame({'sale_mean':means})
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...