Question

Мои файлы имеют два формата ... некоторые имеют # строк в начале, а некоторые - нет.Я хочу прочитать приведенную выше матрицу в pandas dataframe и хочу игнорировать строки с # перед заполнением моего dataframe.Мои заголовки должны быть идентификатором SID и AID и т. Д. ..... поэтому я думаю, что могу прочитать файл, пропустив первые 4 строки, и я знаю, как это сделать.Но проблема в том, что существуют файлы, в которых строки donot имеют первые строки 4 # и напрямую начинаются с заголовков ID SID AID ....

Когда я читаю во фрейме данных, я предполагаю, что имя столбца присваивается как #PI

Tom Johnson · Answer 1 · 05 февраля 2019

Функция pandas read_csv позволяет указать символ комментария с помощью comment='#'.Это будет игнорировать любые строки, начинающиеся с #.

piedpiper · Answer 2 · 05 февраля 2019

Почему бы просто не прочитать все строки, используя read_csv, а затем отфильтровать строки с помощью #, используя .loc?

Что-то вроде

df.loc[~df['col'].str.startswith('#')]

Python / Pandas - как читать _csv и одновременно игнорировать строки с #?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Python / Pandas - как читать _csv и одновременно игнорировать строки с #?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы