У меня есть фрейм данных dfyg
, который является объектом Groupby, содержащим 120000 групп.Как лучше всего выбрать 10000 из этих групп и передать их в функцию multiprocessing.Pool.map()
?
Я могу вспомнить цикл for, который выбирает 10 000 групп и помещает их в список.Я не могу отфильтровать кадр данных перед группировкой, потому что я хотел бы либо передать все строки в группе в функцию map
, либо ни в одну вообще.
i = 0
iter_list = []
for name, group in dfyg:
iter_list.append(group)
i = i + 1
if i >= 10000:
break