Я использую Python и Pandas, пытаюсь эффективно суммировать значения данных в разных строках на основе списков идентификаторов вместо уникальных идентификаторов.
df:
Name - ID - Related IDs - Value
z - 123 - ['aaa','bbb','ccc'] - 10
w - 456 - ['aaa'] - 20
y - 789 - ['ggg','hhh','jjj'] - 50
x - 012 - ['jjj','hhh'] - 60
r - 015 - ['hhh'] - 15
Можно будет попробоватьразбить каждую строку на элемент списка, но он может дублировать значения для суммирования, и это может быть неэффективным решением с точки зрения времени и ресурсов.
```python
f = {'Sum': 'sum'}
df = df.groupby(['Related IDs']).agg(f)
#it is not working has is matching element wise
#rather then by element
df = df.reset_index()
```
Я ожидаю, что это новый столбец«Сумма», которая суммирует значения «Значение» строк, которые имеют один или несколько общих идентификаторов.Как следующее:
Name - ID - Related IDs - Value - Sum
z - 123 - ['aaa','bbb','ccc'] - 10 - 30
w - 456 - ['aaa'] - 20 - 30
y - 789 - ['ggg','hhh','jjj'] - 50 - 125
x - 012 - ['jjj','hhh'] - 60 - 125
r - 015 - ['hhh'] - 15 - 125