Я довольно новичок в Python, поэтому, возможно, я ищу простое решение, но все, что я пробовал до сих пор, было бесплодным.
У меня есть сотни CSV-файлов с одинаковым форматом. Формат у меня есть
- Имя файла (неважно)
- Однозначное значение (неважно)
- Важные имена столбцов
- еще две строки несущественного форматирования мусора
- Тысячи строк важных данных
- Несколько пустых строк
- Тысячи рядов несущественного мусора снова
Мне нужно отформатировать его, чтобы я мог легко получить названия столбцов и важные данные внизу. Формат установлен так, что имена столбцов всегда находятся в строке 5, а данные всегда начинаются со строки 8, но объем данных может варьироваться от нескольких сотен до нескольких тысяч.
РЕДАКТИРОВАТЬ: Я получил точный номер строки заголовка неправильно. Кроме того, я забыл упомянуть, что мне нужно сохранить результат в кадре данных для последующего анализа.
Это изображение верхней части файла CSV
Это изображение нижней части файла CSV. Обратите внимание, что при переключении с «важных данных» на «неважные данные» количество столбцов увеличивается, что может затруднить программирование.
