Python / Pandas - как читать _csv и одновременно игнорировать строки с #? - PullRequest
0 голосов
/ 05 февраля 2019

enter image description here

Мои файлы имеют два формата ... некоторые имеют # строк в начале, а некоторые - нет.Я хочу прочитать приведенную выше матрицу в pandas dataframe и хочу игнорировать строки с # перед заполнением моего dataframe.Мои заголовки должны быть идентификатором SID и AID и т. Д. ..... поэтому я думаю, что могу прочитать файл, пропустив первые 4 строки, и я знаю, как это сделать.Но проблема в том, что существуют файлы, в которых строки donot имеют первые строки 4 # и напрямую начинаются с заголовков ID SID AID ....

Когда я читаю во фрейме данных, я предполагаю, что имя столбца присваивается как #PI

Ответы [ 2 ]

0 голосов
/ 05 февраля 2019

Функция pandas read_csv позволяет указать символ комментария с помощью comment='#'.Это будет игнорировать любые строки, начинающиеся с #.

0 голосов
/ 05 февраля 2019

Почему бы просто не прочитать все строки, используя read_csv, а затем отфильтровать строки с помощью #, используя .loc?

Что-то вроде

df.loc[~df['col'].str.startswith('#')]
...