Я хочу прочитать следующий файл "test.csv" в Pandas:
# TEXT 1
# TEXT 2
# STN,YYYYMMDD, HH, DD, FH, FF, FX
#
225,19900101, 1, 110, 36, 41, 46
225,19900101, 2, 90, 36, 36, 51
225,19900101, 3, 120, 31, 31, 46
В CSV я хочу пропустить все строки, которые начинаются с #, и я хочу использовать третью строку как заголовки (имена столбцов), без указания символа # в заголовке.
Что работает::
df = pd.read_csv(filename, header=2)
df = df.iloc[1:].reset_index(drop=True)
df.rename(columns={"# STN": "STN"},inplace=True)
Что дает:
STN YYYYMMDD HH DD FH FF FX
0 225 19900101.0 1.0 110.0 36.0 41.0 46
1 225 19900101.0 2.0 90.0 36.0 36.0 51
2 225 19900101.0 3.0 120.0 31.0 31.0 46
Но мне интересно, есть ли способ импорта, чтобы пропустить этот # -характер как строки и получить заголовки без # -символа (поэтому мне не нужно вручную находить, какие строки мне нужно пропустить и где найти заголовки)?