У меня есть файл CSV, который я хочу свернуть.
Файл выглядит так:
Ticker | Date | Marketcap
A | 2002-03-14 | 600000
A | 2002-03-14 | 520000
A | 2004-03-16 | 400000
A | 2004-03-16 | 680000
A | 2008-07-14 | 500000
A | 2010-03-14 | 300000
AB | 2010-02-14 | 1200000
AB | 2010-02-14 | 930000
AB | 2010-02-14 | 1600000
AB | 2012-05-02 | 1600000
AB | 2012-05-02 | 1300000
Как вы можете видеть, len (A) / = len (AB) и рыночные колпачки для повторных дат не одинаковы для каждой записи одного и того же тикера.
Что мне нужно сделать, так это вычислить средние каждого тикера с той же датой , а затем проанализировать эти средние в новом CSV, который выглядит следующим образом тип выход :
Ticker | Date | Avg Marketcap
A | 2002-03-14 | 560000
A | 2004-03-16 | 540000
A | 2008-07-14 | 500000
A | 2010-03-14 | 300000
AB | 2010-02-14 | 124333
AB | 2012-05-02 | 1450000
Я попытался начать поиск примеров кодов, но все, что я могу найти, - это объединить два файла вместе или несколько фреймов данных; ничего в том же наборе.
Мой код просто анализирует мой файл и в настоящее время выглядит так:
#Parse values from 2003 and above
df = pd.read_csv(data_market)
df = df[(df['Date'] > '2003-01-01')]
df = df[['Ticker','Date','Marketcap']]
#Dropping duplicate values
df.drop_duplicates(subset=None, inplace=True)