Как быстро разобраться с огромным файлом .gz? - PullRequest
0 голосов
/ 29 марта 2020

Очень простой вопрос grep, но я ожидаю хитростей для повышения производительности!

Я использую следующий код для сопоставления списка идентификаторов в файле с другим огромным сжатым файлом .gz (~ 20G) .

zcat my.gz | grep -wFf my.list > output.txt

Поскольку этот код сначала распаковывает файл .gz, а затем сопоставляет мой список идентификаторов 100k с распакованным файлом, это стоит слишком много времени!

Есть ли способ, которым можно обработать работа быстрее?

Спасибо!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...