Группировка и уменьшение на основе значений столбцов в пандах - PullRequest
0 голосов
/ 04 февраля 2019

Я прошу прощения, если заголовок не ясен, но мне было трудно сформулировать заголовок.Вероятно, будет лучше, если я просто покажу, что я хотел бы сделать.

У меня есть кадр данных, который выглядит следующим образом

enter image description here

В основном имена столбцов и значения в этом конкретном столбце совпадают.

Теперь я пытаюсь уменьшить размер кадра данных следующим образом:

enter image description here

Я попытался сгруппировать по идентификатору и столбцу обратной засыпки, удалив дубликаты, но, поскольку у меня около 10 миллионов записей, это неэффективно с точки зрения вычислений.Буду очень признателен, если смогу найти лучшее решение для следующей проблемы.

...