Question

У меня есть файл чисел в каждой новой строке: $ cat test

, который я хочу найти в другом файле большего размера с несколькими полями, разделенными запятыми, и вывести результаты в

700320947.csv
700509217.csv
701113187.csv
701435748.csv
701435889.csv
701667717.csv
701668467.csv
702119126.csv
702306577.csv
702914910.csv

Логика:

ls test | while read file; do zgrep $line *large*file*gz >> $line.csv ; done

Пожалуйста, помогите. Спасибо

Michael J. Barber · Answer 1 · 25 октября 2011

Поскольку ничего не сказано о структуре большого файла, я просто предположу, что тестируемые числа находятся во втором столбце большого файла; обобщать по мере необходимости.

Это можно сделать за один проход через каждый из файлов, используя перенаправление вывода в awk:

awk -F"," 'FILENAME == "test" { num[$1]=1; next } 
  num[$2] { print > $2".csv" }' test bigfile

Bohemian · Answer 2 · 25 октября 2011

Сначала распакуйте большой файл;использование zgrep означает разархивирование на лету для каждой строки числового файла ... очень неэффективно.После распаковки большого файла это будет сделано:

for number in `cat test`; do grep $number bigfile > $number.csv; done

Отредактировано:

Чтобы ограничить попадания только целыми словами (например, 702119126 не будет совпадать 1702119126), добавьтеграницы слова для регулярного выражения:

for number in `cat test`; do grep \\b$number\\b bigfile > $number.csv; done

искать шаблон в файле и выводить каждый результат шаблона в свой собственный файл, используя awk, sed

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Отредактировано:

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

искать шаблон в файле и выводить каждый результат шаблона в свой собственный файл, используя awk, sed

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Отредактировано:

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов