Я пытаюсь добавить столбец значений на основе номеров счетов и отобразить результат в новом столбце.Кроме того, я идентифицирую первый экземпляр контокоррентного счета как уникальное значение, а остальные - как дубликаты.Например:
Index CA# Duplicate? $ $$
1 1101 True 440.4 880.80
2 1101 False 440.4 -
3 1102 True 440.8 440.80
4 1103 True 441.2 441.20
5 1106 True 442.4 1,327.20
6 1106 False 442.4 -
7 1106 False 442.4 -
Мой первый столбец 'CA#'
- это идентификаторы, которые я хочу пометить как True(or 1)
, если они являются первыми и единственными CA#
, в противном случае я хочу, чтобы они были помечены как False(or 0)
.Например, CA# 1101 on Index 1
получит True
, а CA# 1101 on Index 2
получит False
.
Затем я пытаюсь использовать этот флаг True для суммирования суммы, с которой связан каждый CA#
в столбце $
.В случае CA#1101
общая сумма $$
равна 880.80
.До сих пор я только пытался сгенерировать новый столбец, который имеет логический идентификатор для уникальных значений в столбце CA #, но я получаю только значения True в новых сериях, которые создает мой код, и я знаю, что это неправильно,
import pandas as pd
from pandas import DataFrame, Series
import numpy as np
file_name= ('A:\LEO\Documents\Mock data.xlsx')
sheet_name= ('Sheet1')
data = pd.read_excel(io= file_name, sheet= sheet_name)
data.sort_values('CA#', inplace= True)
data_ltd = DataFrame(data, columns=['CA#','$'])
bool_series = data_ltd['CA'].duplicated()
data_ltd ['bool_series'] = bool_series
print(data_ltd[bool_series].head(10))