Очень простой вопрос grep, но я ожидаю хитростей для повышения производительности!
Я использую следующий код для сопоставления списка идентификаторов в файле с другим огромным сжатым файлом .gz (~ 20G) .
zcat my.gz | grep -wFf my.list > output.txt
Поскольку этот код сначала распаковывает файл .gz, а затем сопоставляет мой список идентификаторов 100k с распакованным файлом, это стоит слишком много времени!
Есть ли способ, которым можно обработать работа быстрее?
Спасибо!