Я хочу создать Python фрейм данных, который подсчитывает, сколько раз типы C или P встречаются для каждой даты в каждом образец. C и P являются подмножествами F, означающими, что всякий раз, когда Type равен F , я могу посчитать количество строк с одинаковым значением Sample и то же самое Дата значение.
Я не могу жестко закодировать условия, так как фактический набор данных намного больше, чем образец. Это означает, что мне нужно основывать свои условия на значениях в наборе данных, где Тип равен F .
Вот пример моего набора данных, df_Data ( намного больше):
Пример | Тип | Дата | Strike
A | F | 1 июня 2020 |
A | C | 1 июня 2020 | 5
A | P | 1 июня 2020 | 2,5
А | F | 1 De c 2020 |
A | P | 1 De c 2020 | 3
А | P | 1 De c 2020 | 3,5
А | P | 1 De c 2020 | 4
B | F | 1 июня 2020 |
B | C | 1 июня 2020 | 2,5
B | C | 1 июня 2020 | 3
B | C | 1 июня 2020 | 4
B | F | 1 De c 2020 |
B | C | 1 De c 2020 | 2
B | C | 1 De c 2020 | 4
B | P | 1 De c 2020 | 2
B | P | 1 De c 2020 | 4
Соответствующий вывод представляет собой новый кадр данных, подобный этому:
Пример | Тип | Дата | Count
=======================
A | F | 1 Jun 2020 |2
A | F | 1 Dec 2020 |3
B | F | 1 Jun 2020 |3
B | F | 1 Dec 2020 |4
В Excel я бы использовал функцию CountIfs:
IF Type = "F", затем счетчики (столбец выборки, значение выборки, столбец даты, значение даты, столбец типа, "<> F")
Пожалуйста, помогите (извинения за плохое форматирование таблицы).