У меня нет особого опыта работы с bcftools, но в целом. Если вы хотите использовать awk
для манипулирования gzip-файлом, вы можете направить на него канал так, чтобы только распаковать файл по мере необходимости, вы также можете передать результат напрямую через gzip, поэтому он тоже сжимается, например
gzip -cd largeFile.vcf.gz | awk '{ <some awk> }' | gzip -c > newfile.txt.gz
Также zcat
- это псевдоним для gzip -cd
, -c
- ввод / вывод для стандартного выхода, -d
- распаковка.
В качестве примечания, если вы пытаетесь выполнить операции только с частью большого файла, вы также можете найти отличный инструмент less
, полезный, его можно использовать для просмотра вашего большого файла, загружая только необходимые части, * Параметр 1012 * особенно полезен для широких форматов с большим количеством столбцов, поскольку останавливает перенос строк, как и -N
для отображения номеров строк.
less -S largefile.vcf.gz
выйдите из режима просмотра с помощью q
, а g
приведет вас к началу файла.