Подсчет отдельных строк в многоиндексированном фрейме данных - PullRequest
0 голосов
/ 29 ноября 2018

У меня есть нижнее подмножество моих данных, которое показывает информацию игрока с битой о количестве пробежек, которые он забил в каждом иннинге.

подмножество данных

Теперь я создал группу для "batsman" и "inning".Я принял во внимание количество иннингов, количество мячей и сумму набранных им пробежек, чтобы определить в каждом иннинге, сколько пробежек он набрал.

Ниже приведено заявление по группам.

batsman_data_2 = deliveries_data.groupby(['batsman','inning']).aggregate({
    'inning': 'count',
    'ball': 'count',
    'batsman_runs': 'sum'
    })

Фактический объем производства. Фактический результат

Ожидаемый результат Ожидаемый результат

Проблема здесь в том, что «иннинг» не считается уникальным.Вместо этого он считает все строки всякий раз, когда есть определенное значение.Например, в приведенном выше подмножестве количество иннингов 1 должно быть 1, и аналогично для иннинга 2 оно должно равняться 1. Вместо этого оно дает соответственно 6 и 5, что является ничем иным, как количеством сталкивающихся шаров.

Итак, мой вопрос в этом сценарии, как взять уникальные значения для каждого иннинга.

Надеюсь, я получу помощь и спасибо заранее !!Mukund G Kallapur

...