У меня есть несколько CSV-файлов, которые я загружаю в каталог.
каждый .csv должен иметь 3 столбца информации. Заголовок одного из этих файлов выглядит так:
17/07/2014,637580,10.755
18/07/2014,61996,10.8497
21/07/2014,126758,10.8208
22/07/2014,520926,10.8201
23/07/2014,370843,9.2883
Код, который я использую для чтения .csv в фрейм данных (df):
df = pd.read_csv(adj_directory+'\\'+filename, error_bad_lines=False,names=['DATE', 'PX', 'RAW'])
Где я назову три столбца (DATE, PX и RAW).
Это прекрасно работает, когда файл отформатирован правильно. Однако я заметил, что иногда .csv имеет немного другой формат и может выглядеть, например:
09/07/2014,26268315,,
10/07/2014,6601181,16.3857
11/07/2014,916651,12.5879
14/07/2014,213357,,
15/07/2014,205019,10.8607
, где отсутствует значение столбца и в месте значений появляется лишняя запятая. Это означает, что файл не загружается в фрейм данных (df
фрейм данных пуст).
Есть ли способ прочитать данные в информационном кадре с дополнительной запятой (игнорируя ошибочную строку), чтобы df
выглядел так:
09/07/2014,26268315,NaN
10/07/2014,6601181,16.3857
11/07/2014,916651,12.5879
14/07/2014,213357,NaN
15/07/2014,205019,10.8607
Спасибо