Мне интересно, как наиболее эффективно суммировать элементы массива по заданным характеристикам. Например, у меня есть 1000 данных розыгрыша, и я ищу сумму всех розыгрышей (столбец) по полу для данного года заболевания (т. Е. Количество розыгрышей по полу, году, заболеванию, и я хочу сумма обоих полов для каждого года и болезни).
import numpy as np
year = np.repeat((1980, 1990 , 2000, 2010), 10)
sex = np.array(['male', 'female']*20)
disease = np.repeat(('d1', 'd2', 'd3', 'd4', 'd5', 'd6', 'd7', 'd8'), 5)
draws = np.random.normal(0, 1, size=(sex.shape[0], 1000))
Есть какие-нибудь мысли о том, как получить массив, который будет иметь форму (20, 1000), который имеет сумму ничьей между обоими полами для данного года болезни? Я также должен быть в состоянии сделать это в ситуациях, когда данные не являются совершенно квадратными (есть годы заболевания, у которых есть только один пол).