Не будучи экспертом по эффективности кода (пока) и лучшему написанию кода на pythonic (пока), я хотел бы спросить экспертов здесь, является ли следующий код лучшим для join
фреймов данных, имеющих общий индекс даты, илиесли слияние или конкат могут быть лучше:
data = df1.join(df2).join(df3).join(df4).join(df5).dropna()
Я использовал суффикс .dropna()
в конце, чтобы отменить строки, в которых встречается один NaN
.
Примечание: причина, по которой NaN
возникает в этом наборе данных, заключается в том, что я создал кадры данных, которые фактически являются сдвинутыми версиями других кадров данных (с использованием .shift(n)
), что означает, что NaN
s закрадывается вглава сдвинутых информационных фреймов.
Я намерен использовать этот код во многих других приложениях, поэтому хотел использовать наилучшую возможную методологию (т.е. не использовать ненужное использование памяти, отнимать слишком много времени на обработку, использоватьправильные конструкции join / merg / concat).