У меня есть такой фрейм данных, что переменные в первых n столбцах одинаковы, например, для 2 строк, и я хотел бы агрегировать по столбцам с переименованием, которые имеют тип float. Вот пример:
import pandas as pd
import numpy as np
data=[[1,2,np.nan,'string', 100, 200],[1,2,np.nan,'string',102,202],[1,2,5,0.5,1000,2000],[1,2,5,0.5,1002,2002]]
pd.DataFrame(data=data,columns=['Var1','Var2','Var3','Var4','Var5','Var6'])
Var1 Var2 Var3 Var4 Var5 Var6
0 1 2 NaN string 100 200
1 1 2 NaN string 102 202
2 1 2 5.0 0.5 1000 2000
3 1 2 5.0 0.5 1002 2002
Итак, в этом фрейме данных я хотел бы найти среднее значение Var5
и Var6
для каждых 2 строк. Предполагаемый результат будет следующим:
Var1 Var2 Var3 Var4 Var5 Var6
0 1 2 NaN string 101 201
1 1 2 5.0 0.5 1001 2001
Есть ли способ сделать это, если типы данных одних и тех же функций несовместимы? Например, Var3
может быть nan
и числом с плавающей точкой.