Каков наиболее эффективный способ каскадирования данных? - PullRequest
0 голосов
/ 10 марта 2019

У меня есть датафрейм панд, который выглядит следующим образом:


| ID | in_response_to |

| 1 | N |

| 2 | 1 |

| 3 | 2 |

| 4 | N |

| 5 | 3 |

| 6 | 4 |

| 7 | 5 |

Здесь N относится к None и является корнем.

Я хочу привести все идентификаторы, исходящие от одних и тех же родителей, в один и тот же массив. В приведенных выше данных [1,2,3,5] должны принадлежать одному каскаду и [4,6,7] к другому. Я могу вообразить цикл по базе данных, но это займет очень много времени. Какие варианты у меня есть?

...