У меня есть следующий csv, и мне нужно получить дублированные значения из столбца DialedNumer, а затем среднюю длительность этих дубликатов.
введите описание изображения здесь
У меня уже есть дубликаты со следующим кодом:
df = pd.read_csv('cdrs.csv')
dnidump = pd.DataFrame(df, columns=['DialedNumber'])
pd.options.display.float_format = '{:.0f}'.format
dupl_dni = dnidump.pivot_table(index=['DialedNumber'], aggfunc='size')
a1 = dupl_dni.to_frame().rename(columns={0:'TimesRepeated'}).sort_values(by=['TimesRepeated'], ascending=False)
b = a1.head(10)
print(b)
Вывод:
DialedNumber TimesRepeated
50947740194 4
50936564292 2
50931473242 3
Я не могу понять, как получить продолжительность среднее количество дубликатов, есть идеи?
thx