Я хочу обновлять лист каждый раз, когда выполняется определенный процесс, но в моих данных отсутствуют некоторые столбцы. Моя идея состояла в том, чтобы получить все имена столбцов из листа, создать пустой фрейм данных с этими столбцами, а затем объединить его с моими фактическими данными (с переименованными столбцами, чтобы они соответствовали столбцам в листе), с отсутствующими полями, имеющими NaN или Нет значение. Идея состоит в том, чтобы заполнить фрейм данных всеми столбцами только доступными данными.
>>> df1
Empty DataFrame
Columns: [col0, col1, col2, col3, col4, col5, col6, col7]
>>> df2
col1 col2 col4 col7
0 1 2 4 7
>>> magic()
col0 col1 col2 col3 col4 col5 col6 col7
0 NaN 1 2 NaN 4 NaN NaN 7
Я пробовал с merge
, но я получил дубликаты существующих столбцов. Я мог бы проверять столбец за столбцом, если есть допустимое значение, но я бы хотел (если оно существует) векторизованное решение, чтобы его можно было легко масштабировать (сейчас у меня есть только одна строка данных в каждом процессе, но это может быть подробнее).
Есть идеи, как этого добиться оптимизированным способом?
Заранее спасибо.