Привет, ребята. У меня есть dataFrame, в котором я хочу сгруппировать строки по столбцу, а затем найти все строки, которые суммируются до заданного значения в другом столбце.
**A** **B** **c**
XCD 1 5
FFF 12 2
VB 3 6
XCD 8 5
AAA 2 7
AAA 5 7
XCD 4 5
VB 6 6
VB 3 6
FFF 2 2
Для каждой уникальной записи в В столбце A, скажем, XCD, значение столбца C всегда одинаково для представления общей суммы, необходимой для уникальной записи. Чтобы проиллюстрировать, что мне нужно, см. Приведенный ниже окончательный кадр данных.
**A** **B** **c**
XCD 1 5
XCD 4 5
FFF 2 2
VB 6 6
AAA 2 7
AAA 5 7
Алгоритм должен выбрать строки, которые суммируются до столбца c. Алгоритм может выбрать одну строку, если ее общая сумма равна числу в столбце c, но мы берем только первое вхождение, которое суммируется до столбца c, и оставляем остальные, а затем получаем новый фрейм данных