У меня есть набор данных, по которому я пытаюсь получить суммированное значение для каждой группы, если подгруппа в каждой группе удовлетворяет определенному условию. Я не уверен, возможно ли это, или я неправильно подхожу к этой проблеме.
Мои данные структурированы следующим образом:
+----+-------------+---------+-------+
| ID | Transaction | Product | Value |
+----+-------------+---------+-------+
| 1 | A | 0 | 10 |
| 1 | A | 1 | 15 |
| 1 | A | 2 | 20 |
| 1 | B | 1 | 5 |
| 1 | B | 2 | 10 |
+----+-------------+---------+-------+
В этом примере я хочу получить сумму значений с помощью ID column
, если транзакция не содержит продуктов с меткой 0. В описанном выше сценарии все значения, связанные с Transaction A
, будут исключены, поскольку Product 0
Был куплен. С результатом:
+----+-------------+
| ID | Sum of Value|
+----+-------------+
| 1 | 15 |
+----+-------------+
Этот процесс будет повторяться для нескольких IDs
с каждым идентификатором, содержащим только сумму значений, если транзакция не содержит продукт 0.