Как я могу использовать обратные или отрицательные подстановочные знаки при сопоставлении с образцом в оболочке unix / linux? - PullRequest
302 голосов
/ 20 октября 2008

Скажем, я хочу скопировать содержимое каталога, исключая файлы и папки, имена которых содержат слово «Музыка».

cp [exclude-matches] *Music* /target_directory

Что нужно сделать вместо [exclude-match] для достижения этой цели?

Ответы [ 11 ]

347 голосов
/ 20 октября 2008

В Bash вы можете сделать это, включив опцию extglob, например так (замените ls на cp и, конечно, добавьте целевой каталог)

~/foobar> shopt extglob
extglob        off
~/foobar> ls
abar  afoo  bbar  bfoo
~/foobar> ls !(b*)
-bash: !: event not found
~/foobar> shopt -s extglob  # Enables extglob
~/foobar> ls !(b*)
abar  afoo
~/foobar> ls !(a*)
bbar  bfoo
~/foobar> ls !(*foo)
abar  bbar

Позже вы можете отключить extglob с помощью

shopt -u extglob
213 голосов
/ 20 октября 2008

Параметр оболочки extglob обеспечивает более мощное сопоставление с образцом в командной строке.

Вы включаете его с помощью shopt -s extglob, а выключаете с помощью shopt -u extglob.

В вашем примере вы бы сначала сделали:

$ shopt -s extglob
$ cp !(*Music*) /target_directory

Полный список доступных ext окончен glob Операторы bing (отрывок из man bash):

Если опция оболочки extglob включена с помощью встроенной функции shopt, несколько расширенных операторы сопоставления с образцом распознаются. В следующем описании, пэт tern-list - это список из одного или нескольких шаблонов, разделенных знаком |. Композитные узоры может быть сформирован с использованием одного или нескольких из следующих подэлементов:

  • ? (Шаблон)
    Соответствует нулю или одному вхождению данных паттернов
  • * (шаблон)
    Совпадает с нулем или более вхождений данных шаблонов
  • + (шаблон)
    Соответствует одному или нескольким вхождениям данных шаблонов
  • @ (шаблон)
    Соответствует одному из заданных шаблонов
  • ! (Шаблон)
    Совпадает с чем угодно, кроме одного из заданных шаблонов

Так, например, если вы хотите перечислить все файлы в текущем каталоге, которые не являются .c или .h файлами, вы должны сделать:

$ ls -d !(*@(.c|.h))

Конечно, нормальное сглаживание оболочки работает, поэтому последний пример можно записать так:

$ ls -d !(*.[ch])
22 голосов
/ 20 октября 2008

Не в bash (о котором я знаю), но:

cp `ls | grep -v Music` /target_directory

Я знаю, что это не совсем то, что вы искали, но это решит ваш пример.

7 голосов
/ 20 октября 2008

Если вы хотите избежать затрат на использование команды exec, я думаю, вы можете добиться большего успеха с xargs. Я думаю, что следующее является более эффективной альтернативой

find foo -type f ! -name '*Music*' -exec cp {} bar \; # new proc for each exec



find . -maxdepth 1 -name '*Music*' -prune -o -print0 | xargs -0 -i cp {} dest/
5 голосов
/ 28 ноября 2015

В bash альтернативой shopt -s extglob является GLOBIGNORE переменная . Это не совсем лучше, но мне легче запомнить.

Примером может быть то, что хотел оригинальный плакат:

GLOBIGNORE="*techno*"; cp *Music* /only_good_music/

Когда закончите, unset GLOBIGNORE, чтобы иметь возможность rm *techno* в исходном каталоге.

4 голосов
/ 18 февраля 2011

Мое личное предпочтение - использовать команду grep и while. Это позволяет писать мощные, но читаемые сценарии, гарантирующие, что вы в конечном итоге будете делать именно то, что вам нужно. Кроме того, с помощью команды echo вы можете выполнить пробный прогон перед выполнением фактической операции. Например:

ls | grep -v "Music" | while read filename
do
echo $filename
done

распечатает файлы, которые вы в конечном итоге скопируете. Если список верен, то следующим шагом будет просто заменить команду echo командой copy следующим образом:

ls | grep -v "Music" | while read filename
do
cp "$filename" /target_directory
done
4 голосов
/ 20 октября 2008

Вы также можете использовать довольно простой цикл for:

for f in `find . -not -name "*Music*"`
do
    cp $f /target/dir
done
3 голосов
/ 13 марта 2017

Уловка, которую я еще не видел здесь, которая не использует extglob, find или grep, заключается в обработке двух списков файлов как наборов и "diff" их с использованием comm

comm -23 <(ls) <(ls *Music*)

comm предпочтительнее, чем diff, потому что у него нет лишних сует.

Возвращает все элементы набора 1, ls, которые не также в наборе 2, ls *Music*. Это требует, чтобы оба набора были в отсортированном порядке для правильной работы. Нет проблем для ls и расширения glob, но если вы используете что-то вроде find, обязательно вызовите sort.

comm -23 <(find . | sort) <(find . | grep -i '.jpg' | sort)

Потенциально полезно.

3 голосов
/ 20 октября 2008

Одно решение для этого можно найти с помощью find.

$ mkdir foo bar
$ touch foo/a.txt foo/Music.txt
$ find foo -type f ! -name '*Music*' -exec cp {} bar \;
$ ls bar
a.txt

Поиск имеет довольно много опций, вы можете довольно точно указать, что вы включаете и исключать.

Редактировать: Адам в комментариях отметил, что это рекурсивно. параметры поиска mindepth и maxdepth могут быть полезны для управления этим.

2 голосов
/ 28 февраля 2011

В следующих работах перечислены все файлы *.txt в текущем каталоге, кроме тех, которые начинаются с цифры.

Работает в bash, dash, zsh и во всех других POSIX-совместимых оболочках.

for FILE in /some/dir/*.txt; do    # for each *.txt file
    case "${FILE##*/}" in          #   if file basename...
        [0-9]*) continue ;;        #   starts with digit: skip
    esac
    ## otherwise, do stuff with $FILE here
done
  1. В первой строке шаблон /some/dir/*.txt вызовет цикл for для всех файлов в /some/dir, имя которых заканчивается на .txt.

  2. Во второй строке оператор case используется для отсеивания нежелательных файлов. - Выражение ${FILE##*/} удаляет любой начальный компонент имени dir из имени файла (здесь /some/dir/), так что скороговорки могут сопоставляться только с базовым именем файла. (Если вы только отсеиваете имена файлов на основе суффиксов, вы можете сократить это значение до $FILE.)

  3. В третьей строке все файлы, соответствующие строке case pattern [0-9]*), будут пропущены (оператор continue переходит к следующей итерации цикла for). - Если вы хотите, вы можете сделать что-то более интересное здесь, например. например, пропустить все файлы, которые не начинаются с буквы (a – z), используя [!a-z]*, или вы можете использовать несколько шаблонов для пропуска нескольких типов имен файлов, например, [0-9]*|*.bak для пропуска файлов как .bak, так и файлов, которые не начинаются с цифры.

...