Во-первых, вам нужно получить номер строки столбца id
для каждого файла в каталоге (предполагается, что это все .txt
файлы; измените условие соответствующим образом).Это можно сделать следующим образом:
import os
skip_rows = {}
for filename in os.listdir():
if os.splitext(filename)[1] == '.txt':
with open(filename) as f:
lines = f.readlines()
skip_rows[filename] = [index for index, line in enumerate(lines) if line[:2] == 'id'][0]
Теперь skip_rows
должно содержать количество строк, которые нужно пропустить для каждого файла.
Затем вы можете сделать это:
dataframes = {filename: pd.read_csv(filename, skiprows=n_rows) for filename, n_rows in skip_rows.items()}
и считывание каждого элемента в dataframes
.