Pandas читать csv пропуск # символ - PullRequest
0 голосов
/ 29 марта 2020

Я хочу прочитать следующий файл "test.csv" в Pandas:

# TEXT 1
# TEXT 2
# STN,YYYYMMDD,   HH,   DD,   FH,   FF,   FX
# 
  225,19900101,    1,  110,   36,   41,   46
  225,19900101,    2,   90,   36,   36,   51
  225,19900101,    3,  120,   31,   31,   46

В CSV я хочу пропустить все строки, которые начинаются с #, и я хочу использовать третью строку как заголовки (имена столбцов), без указания символа # в заголовке.

Что работает::

df = pd.read_csv(filename, header=2)
df = df.iloc[1:].reset_index(drop=True)
df.rename(columns={"# STN": "STN"},inplace=True)

Что дает:

      STN    YYYYMMDD     HH     DD     FH     FF     FX
0     225  19900101.0    1.0  110.0   36.0   41.0     46
1     225  19900101.0    2.0   90.0   36.0   36.0     51
2     225  19900101.0    3.0  120.0   31.0   31.0     46

Но мне интересно, есть ли способ импорта, чтобы пропустить этот # -характер как строки и получить заголовки без # -символа (поэтому мне не нужно вручную находить, какие строки мне нужно пропустить и где найти заголовки)?

...