У меня есть несколько CSV-файлов, из которых я должен прочитать некоторые конкретные данные (столбцы), но проблема в том, что некоторые файлы вообще не имеют этих столбцов.Поскольку я пытаюсь выяснить качество данных и проверяю эти недостающие данные, всякий раз, когда я вообще не нахожу столбец в файле, я хочу иметь возможность его создать и заполнить его NaN.
Есть ли способ сделать это в Python?Панды?
Заранее благодарю за помощь
Предполагая, что у вас есть все файлы CSV, считанные в фрейм данных,
l=[df1,df2,...] d={x: y.reset_index(level=0,drop=True) for x , y in pd.concat(l,keys=range(len(l))).groupby(level=0)}
Затем вы можете получить доступ к df по
df
d[0]