pandas выбор строк, сумма которых равна значению в другом столбце - PullRequest
0 голосов
/ 17 марта 2020

Привет, ребята. У меня есть dataFrame, в котором я хочу сгруппировать строки по столбцу, а затем найти все строки, которые суммируются до заданного значения в другом столбце.

**A**        **B**             **c**


XCD            1                5
FFF           12                2
VB             3                6
XCD            8                5
AAA            2                7
AAA            5                7
XCD            4                5
VB             6                6
VB             3                6
FFF            2                2

Для каждой уникальной записи в В столбце A, скажем, XCD, значение столбца C всегда одинаково для представления общей суммы, необходимой для уникальной записи. Чтобы проиллюстрировать, что мне нужно, см. Приведенный ниже окончательный кадр данных.

**A**        **B**             **c**


XCD            1                5
XCD            4                5
FFF            2                2
VB             6                6
AAA            2                7
AAA            5                7

Алгоритм должен выбрать строки, которые суммируются до столбца c. Алгоритм может выбрать одну строку, если ее общая сумма равна числу в столбце c, но мы берем только первое вхождение, которое суммируется до столбца c, и оставляем остальные, а затем получаем новый фрейм данных

...