bash: / bin / ls: список аргументов слишком длинный - PullRequest
8 голосов
/ 11 августа 2011

Мне нужно составить список большого количества файлов (40000 файлов), как показано ниже:

ERR001268_1_100.fastq  ERR001268_2_156.fastq  ERR001753_2_78.fastq
ERR001268_1_101.fastq  ERR001268_2_157.fastq  ERR001753_2_79.fastq
ERR001268_1_102.fastq  ERR001268_2_158.fastq  ERR001753_2_7.fastq
ERR001268_1_103.fastq  ERR001268_2_159.fastq  ERR001753_2_80.fastq

Моя команда: ls ERR*_1_*.fastq |sed 's/\.fastq//g'|sort -n > masterlist Однако ошибка: bash: /bin/ls: Argument list too long

Однако могу ли я решить эту проблему?Есть ли другой способ сделать список подобным образом с помощью perl / python?

thx

Ответы [ 3 ]

13 голосов
/ 11 августа 2011

Вы сможете заменить ls ERR*_1_*.fastq на find . -name "ERR*_1_*.fastq".
Таким образом, вы можете избежать превращения подстановочного знака в огромный список аргументов.

(Выход find будет содержать начальный символ "./", например, ./ERR001268_1_100.fastq. Если это нежелательно, вы можете избавиться от него с помощью другой команды sed позже в трубопровод.)

1 голос
/ 11 августа 2011

Если в вашем каталоге уже есть все файлы, модуль python "glob" может иметь более высокий предел, чем командная строка bash.

Из командной строки:

python -c "import glob; print glob.glob('ERR_*_1_*.fastq')"

Чтобы сделать все это в Python, вы можете попробовать что-то вроде этого:

import glob
files = glob.glob("ERR_*_1_*.fastq")
trimmedfiles = [x.replace(".fastq","") for x in files]
trimmedfiles.sort()
for f in trimmedfiles:
    print f

Это решение будет сортировать файлы по алфавиту, а не по номерам. Для этого вы можете захотеть добавить магию key = lambda в метод sort ():

trimmedfiles.sort(key=lambda f: int(f.split("_")[2]))
0 голосов
/ 07 ноября 2011

Find может помочь вам - вместо этого используйте l find . -name 'yourpatternhere' -print0 | xargs -0 youractionhere

...