Создание мини / вспомогательных фреймов данных с использованием значений столбцов большой панды DataFrame - PullRequest
0 голосов
/ 05 июля 2018

Я разместил вопрос ранее в этом сообщении . Я думал, что задам этот вопрос отдельно, так как это всего лишь одна операция, чтобы разделить большой фрейм данных на отдельные мини / субфреймы данных.

Скажи, у меня есть df:

    245           245   245           867               867
0   Reddit        NaN   NaN           Facebook          NaN
1   ColumnNeeded  NaN   ColumnValue   ColumnNeeded      ColumnValue
2   RedditInsight NaN   C             FacbookInsights   A
3   RedditText    NaN   H             FacbookText       L

Теперь я хочу два разных фрейма данных, как это, df1:

    245           245   245           
0   Reddit        NaN   NaN           
1   ColumnNeeded  NaN   ColumnValue   
2   RedditInsight NaN   C             
3   RedditText    NaN   H

df2:

    867               867
0   Facebook          NaN
1   ColumnNeeded      ColumnValue
2   FacbookInsights   A
3   FacbookText       L

По сути, я хочу создавать фреймы данных с уникальными значениями заголовков. Я пытался создать такой список:

list_of_dfs = [set(i) for i in df.columns]

Возвращает только значения столбцов,

[{245}, {245}, {245}, {867}, {867}]

Есть идеи, как мне это сделать?

1 Ответ

0 голосов
/ 05 июля 2018

Поскольку вам нужно сбросить индекс и получить субкадры для каждого уникального имени столбцов, вам необходимо:

[df[i].reset_index(drop=True) for i in df.columns.unique()]

Выход:

[             
              245 245          245
 0         Reddit NaN          NaN
 1   ColumnNeeded NaN  ColumnValue
 2  RedditInsight NaN            C
 3     RedditText NaN            H,                

                867          867
 0         Facebook          NaN
 1     ColumnNeeded  ColumnValue
 2  FacbookInsights            A
 3      FacbookText            L
]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...