Расчеты в python с CSV - PullRequest
0 голосов
/ 17 июня 2020

Как я могу рассчитать следующее, используя данные CSV ниже ○ Ежемесячные изменения (выраженные в процентах) ○ Средний доход и затраты (и соответствующие месяцы) ○ Месяцы с наибольшим и наименьшим доходом

year,month,revenue,costs
2020,jan,5415,4206
2020,feb,1894,9843
2020,mar,1965,1802
2020,apr,1066,1709
2020,may,2002,2105
2020,jun,8338,3068
2020,jul,7749,2385
2020,aug,8834,2794
2020,sep,1303,1759
2020,oct,2004,1134
2020,nov,7624,1481
2020,dec,1882,3472

Пока это мой код

import csv
def read_data():
    data=[]
    with open("revenue.csv", "r") as revenue_csv:
        spreadsheet = csv.DictReader(revenue_csv)
def run():
    data=read_data()

    revenue=[]
    for row in data:
        revenue=int(row['revenue'])
        revenue.append(revenue)
    print(revenue)
    print("Highest revenue:{}". format(total))
run()

1 Ответ

0 голосов
/ 17 июня 2020

Если вы выполняете вычисления в CSV, вы хотите использовать модуль pandas

First;

pip install pandas

Затем прочтите в своем CSV:

import pandas as pd 

spreadsheet = pd.read_csv("revenue.csv")

У вас будет Dataframe, с которым вы можете работать

Вы можно напечатать первые 5 строк с помощью:

print(spreadsheet.head())

Если вы хотите рассчитать средний доход, который вы могли бы сделать:

avg_rev = spreadsheet['revenue'].mean()

Остальные операции лежат на вас, вот документация pandas:

https://pandas.pydata.org/docs/

И я рекомендую вам прочитать это:

https://medium.com/@kasiarachuta / basi c -statistics-in- pandas -dataframe-594208074f85

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...