Я не знаю, почему я так сильно борюсь с этим.Я пытаюсь сделать Excel эквивалент эквивалента среднего значения для кадра данных панд.
У меня есть следующее:
df = pd.DataFrame(rng.rand(1000, 7), columns=['1/31/2019', '2/28/2019', '3/31/2019', '4/30/2019', '5/31/2019', '6/30/2019', '7/31/2019'])
У меня также есть столбец:
df['Doc_Number'] = ['A', 'B', 'C', 'B', 'C', 'B', 'A', 'A', 'D', 'G', 'G', 'D', 'G', 'B' ...]
Я хочу сделать Excel-эквивалент средних значений для Doc_Number для каждого столбцаиз df при сохранении структуры кадра данных.Таким образом, в каждом столбце я бы вычислил среднее значение, если бы df ['Doc_Number'] = ['A', 'B', 'C' ...], но я все равно сохранил бы 1000 строк и применил бырассчитать для каждого отдельного столбца ['31.01.2009', '28.02.2009', '31.03.2009' ...].
Для одного столбца я бы сделал что-то вроде:
df['AverageIfs'] = df.groupby('Doc_Number')['1/31/2019'].transform('np.mean')
Но как бы вы применили calc к каждому столбцу df?На самом деле, у меня есть еще много столбцов для применения калькуляции.
Я - полный любитель, так что спасибо, что согласились с моими вопросами.