Структура данных:
HEIGHT Category
51 1
45 1
89 2
Цель: вычислить среднее геометрическое
import pandas as pd
import numpy as np
df = pd.read_csv('BaseFish',delimiter=',')
df.dropna(axis = 0)
df = df[df.HEIGHT != 0]
table = pd.pivot_table(df,values = 'HEIGHT',index = 'Category',aggfunc=(np.prod,np.count_nonzero))
table.insert(2,'GMEAN',0)
table['GMEAN']=table['prod']**(1/table['count_nonzero'])
Проблема: Категории с большим количеством точек данных дают np.prod = бесконечность.Следовательно, окончательный GMEAN также бесконечен.
Мои знания Python очень просты, и единственная причина, по которой я их использую, потому что количество точек данных превышает лимит превышения.