Как можно объединить список DataFrames панд, сохранив дубликаты индексов? - PullRequest
0 голосов
/ 01 июня 2018

У меня есть список многих DataFrames.Каждый DataFrame представляет собой набор различных измерений, соответствующих метке времени.Поскольку многие измерения могут соответствовать одному и тому же моменту времени, во временных индексах фреймов данных имеется много дублирующих индексных записей.

Я хочу объединить этот список фреймов данных и, очевидно, сохранить дублированные индексы.Как это может быть сделано?Я проверил этот вопрос , но решения применимы к случаю объединения только двух DataFrames, а не списка многих DataFrames.Функциональность concat, по-видимому, не может обрабатывать дублирующиеся индексы.

1 Ответ

0 голосов
/ 01 июня 2018

Смотрите комментарий @HarvIpan: это правильно.Вы можете составить список данных pandas:

import pandas as pd
df = pd.DataFrame({'a':[1,2,3],'b':['a','b','c']})
df.set_index('a', inplace=True)

df2 = pd.DataFrame({'a':[1,2,3],'b':['d','e','f']})
df2.set_index('a', inplace=True)

df3 = pd.DataFrame({'a':[1,2,3],'c':['g','e','h']})
df3.set_index('a', inplace=True)

list_of_dfs = [df,df2,df3]

pd.concat(list_of_dfs, sort=False)

    b   c
a       
1   a   NaN
2   b   NaN
3   c   NaN
1   d   NaN
2   e   NaN
3   f   NaN
1   NaN g
2   NaN e
3   NaN h
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...