У меня есть папка с ~ 8400 CSV-файлами, которые большие:
Я устал просто объединять все в Терминале с помощью cat и получил CSV-файл объемом 3,2 ГБ, над которым Excel просто смеялся, когда я пытался импортировать. Поэтому мне нужно уменьшить их, прежде чем объединить их, чтобы я мог начать возиться с данными в Excel. К счастью, мне нужна лишь небольшая часть данных.
По сути, это ежечасный временной ряд, начиная с января 2018 года (первый столбец - дата / время), но мне нужен только номер конца дня за последние 90 дней
- Извлечь последние ~ 2160 строк каждого CSV (90 * 24)
- Мне также нужен разделитель, чтобы показать мне, где начинается каждая таблица после слияния, поэтому после извлечения последних ~ 2160 строк я хочу для вставки в начало каждой строки с именем файла без расширения.
- Удалять все записи каждого дня, кроме последней.
По моим подсчетам, это оставляет мне менее 800 тыс. Строк, которые Excel должен иметь возможность открывать.
Я думал, что все это может сделать sed, а затем cat объединить новые отредактированные файлы, но это выходит за рамки моих возможностей. Любая помощь очень ценится. Спасибо.