Question

У меня есть 8 файлов одного столбца и неодинаковое количество строк в каждом столбце.Мне нужно определить элементы, которые являются общими во всех этих 8 файлах.

Я могу выполнить эту задачу для сравнения двух файлов, но я не могу написать работающий один вкладыш в оболочке, чтобы сделать то же самое.

Любые идеи .....

Заранее спасибо.

Файл 1
Пол
Паван

Файл 2
Раман
Пол
Сладкий
Баруа

Файл 3
Сладкий
Баруа
Пол

Ответсравнение этих трех файлов должно быть Павлом.

Fredrik Pihl · Answer 1 · 02 января 2012

Следующие однострочные должны делать (измените 3 на 8, чтобы соответствовать вашему случаю)

$ sort * | uniq -c | grep 3
      3 Paul

Вероятно, лучше сделать это на python, используя sets ...

eumiro · Answer 2 · 02 января 2012

python -c 'import sys;print "".join(sorted(set.intersection(*[set(open(a).readlines()) for a in sys.argv[1:]])))' File1 File2 File3

печатает Paul для ваших файлов File1, File2 и File3.

Zaid · Answer 3 · 02 января 2012

Perl

$ perl -lnE '$c{$_}{$ARGV}++ }{ print for grep { keys %{$c{$_}} == 8 } keys %c;' file[1-8]

Должна быть возможность избавиться от жесткого кода 8, а также @{[ glob "@ARGV" ]}, но у меня нет времени проверять это сейчас.

Это решение будет правильно обрабатывать наличие дублирующих строк в файлах.

TLP · Answer 4 · 02 января 2012

Здесь я пытался найти краткий способ убедиться, что каждое совпадение происходит из другого файла.Если в файлах нет дубликатов, это довольно просто в perl:

perl -lnwE '$a{$_}++; END { for (keys %a) { print if $a{$_} == 3 } }' files*

Опция -l автоматически скомпонует ваш ввод (удалит новую строку) и добавит новую строку в печать.Это важно в случае отсутствия eof новых строк.

Опция -n будет читать входные данные из аргументов имени файла (или stdin).

Назначение хэша будет считать дубликаты, а блок ENDраспечатает, какие дубликаты появились 3 раза.Измените 3 на любое количество имеющихся у вас файлов.

Если вам нужна более гибкая версия, вы можете посчитать аргументы в блоке BEGIN.

perl -lnwE 'BEGIN { $n = scalar @ARGV } 
    $a{$_}++; END { for (keys %a) { print if $a{$_} == $n } }' files*

potong · Answer 5 · 02 января 2012

Это может работать для вас:

ls file{1..3} | 
xargs -n1 sort -u | 
sort | 
uniq -c | 
sed 's/^\s*'"$(ls file{1..3} | wc -l)"'\s*//p;d'

kev · Answer 6 · 02 января 2012

$ awk '++a[$0]==3' file{1..3}.txt
Paul

обновление

$ awk '(FILENAME SEP $0) in b{next}; b[FILENAME,$0]=1 && ++a[$0]==3' file{1..3}.txt
Paul

Определение общих элементов в нескольких файлах

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 6 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Perl

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

обновление

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Определение общих элементов в нескольких файлах

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 6 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Perl

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

обновление

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов