Странная вещь при удалении элементов списка - PullRequest
0 голосов
/ 29 октября 2019

У меня есть список, содержащий каталоги и файлы, я хочу сохранить только файлы и написать следующий код для его фильтрации. Однако я обнаружил, что некоторые записи все еще находятся в этом списке, например 'wangshx / ,' '`.

Из этого результата я обнаружил, что в предложении if может быть что-то не так. Кто-нибудь может указать, где проблема?

In [7]: filelist = ['/tmp/test2.pbs', '/tmp/test.pbs', '/public/home/ 
   ...: wangshx:', ' ', 'correct_order.txt', 'download/', 'filepaths. 
   ...: RData', 'lib/', 'Log.out', 'ncbi_error_report.xml', 'new_hg19 
   ...: .1.bt2', 'new_hg19.2.bt2', 'new_hg19.3.bt2', 'new_hg19.4.bt2' 
   ...: , 'new_hg19.fa', 'new_hg19.rev.1.bt2', 'new_hg19.rev.2.bt2',  
   ...: 'perl5/', 'practice/', 'repnames_nfragments.txt', 'soft/', 's 
   ...: ongmf/', 'sort.pbs', 'test.pbs', 'test.pbs.o1167575', 'test.p 
   ...: bs.o1167590', 'tmp/', 'wangshx/', 'workspace/', 'wt/', 'wx/', 
   ...:  '']

In [8]: len(filelist)
Out[8]: 32

In [9]:    for f in filelist:
   ...:                 print(f)
   ...: 
   ...: 
/tmp/test2.pbs
/tmp/test.pbs
/public/home/wangshx:

correct_order.txt
download/
filepaths.RData
lib/
Log.out
ncbi_error_report.xml
new_hg19.1.bt2
new_hg19.2.bt2
new_hg19.3.bt2
new_hg19.4.bt2
new_hg19.fa
new_hg19.rev.1.bt2
new_hg19.rev.2.bt2
perl5/
practice/
repnames_nfragments.txt
soft/
songmf/
sort.pbs
test.pbs
test.pbs.o1167575
test.pbs.o1167590
tmp/
wangshx/
workspace/
wt/
wx/


In [10]: for f in filelist:
    ...:     print(f)
    ...:     if f[-1]=='/' or f[-1]==':' or f=='' or f==' ':
    ...:         print("=> Should remove " + f)
    ...:         filelist.remove(f)
    ...: 
/tmp/test2.pbs
/tmp/test.pbs
/public/home/wangshx:
=> Should remove /public/home/wangshx:
correct_order.txt
download/
=> Should remove download/
lib/
=> Should remove lib/
ncbi_error_report.xml
new_hg19.1.bt2
new_hg19.2.bt2
new_hg19.3.bt2
new_hg19.4.bt2
new_hg19.fa
new_hg19.rev.1.bt2
new_hg19.rev.2.bt2
perl5/
=> Should remove perl5/
repnames_nfragments.txt
soft/
=> Should remove soft/
sort.pbs
test.pbs
test.pbs.o1167575
test.pbs.o1167590
tmp/
=> Should remove tmp/
workspace/
=> Should remove workspace/
wx/
=> Should remove wx/

In [11]: filelist
Out[11]: 
['/tmp/test2.pbs',
 '/tmp/test.pbs',
 ' ',
 'correct_order.txt',
 'filepaths.RData',
 'Log.out',
 'ncbi_error_report.xml',
 'new_hg19.1.bt2',
 'new_hg19.2.bt2',
 'new_hg19.3.bt2',
 'new_hg19.4.bt2',
 'new_hg19.fa',
 'new_hg19.rev.1.bt2',
 'new_hg19.rev.2.bt2',
 'practice/',
 'repnames_nfragments.txt',
 'songmf/',
 'sort.pbs',
 'test.pbs',
 'test.pbs.o1167575',
 'test.pbs.o1167590',
 'wangshx/',
 'wt/',
 '']

Best,

Shixiang

Ответы [ 2 ]

1 голос
/ 29 октября 2019

Проблема заключается в редактировании списка во время его перебора. Вместо этого используйте понимание списка. Непонятно, каковы ваши требования к фильтру, но в качестве примера ниже приведен новый список, в котором все, что заканчивается косой чертой:

filelist = ['/tmp/test2.pbs', '/tmp/test.pbs', '/public/home/wangshx:', ' ', 'correct_order.txt', 'download/',
            'filepaths.RData', 'lib/', 'Log.out', 'ncbi_error_report.xml', 'new_hg19.1.bt2', 'new_hg19.2.bt2',
            'new_hg19.3.bt2', 'new_hg19.4.bt2', 'new_hg19.fa', 'new_hg19.rev.1.bt2', 'new_hg19.rev.2.bt2',
            'perl5/', 'practice/', 'repnames_nfragments.txt', 'soft/', 'songmf/', 'sort.pbs', 'test.pbs',
            'test.pbs.o1167575', 'test.pbs.o1167590', 'tmp/', 'wangshx/', 'workspace/', 'wt/', 'wx/', '']

files = [file for file in filelist if not file.endswith('/')]

print(files)

Вывод:

['/tmp/test2.pbs', '/tmp/test.pbs', '/public/home/wangshx:', ' ', 'correct_order.txt', 'filepaths.RData', 'Log.out', 'ncbi_error_report.xml', 'new_hg19.1.bt2', 'new_hg19.2.bt2', 'new_hg19.3.bt2', 'new_hg19.4.bt2', 'new_hg19.fa', 'new_hg19.rev.1.bt2', 'new_hg19.rev.2.bt2', 'repnames_nfragments.txt', 'sort.pbs', 'test.pbs', 'test.pbs.o1167575', 'test.pbs.o1167590', '']
1 голос
/ 29 октября 2019

Исходя из вашего списка, кажется, что вы можете получить что-то такое же простое, как поиск символа . в каждой строке.

Примерно так:

filelist = ['/tmp/test2.pbs', '/tmp/test.pbs', '/public/home/wangshx:', ' ', 'correct_order.txt', 'download/', 'filepaths.RData', 'lib/', 'Log.out', 'ncbi_error_report.xml', 'new_hg19.1.bt2', 'new_hg19.2.bt2', 'new_hg19.3.bt2', 'new_hg19.4.bt2' , 'new_hg19.fa', 'new_hg19.rev.1.bt2', 'new_hg19.rev.2.bt2', 'perl5/', 'practice/', 'repnames_nfragments.txt', 'soft/', 'songmf/', 'sort.pbs', 'test.pbs', 'test.pbs.o1167575', 'test.pbs.o1167590', 'tmp/', 'wangshx/', 'workspace/', 'wt/', 'wx/', '']

for f in filelist:
    if '.' in f:
        print(f)
    else:
        print("=> Should remove " + f)

, которыйвыдаст:

/tmp/test2.pbs
/tmp/test.pbs
=> Should remove /public/home/wangshx:
=> Should remove  
correct_order.txt
=> Should remove download/
filepaths.RData
=> Should remove lib/
Log.out
ncbi_error_report.xml
new_hg19.1.bt2
new_hg19.2.bt2
new_hg19.3.bt2
new_hg19.4.bt2
new_hg19.fa
new_hg19.rev.1.bt2
new_hg19.rev.2.bt2
=> Should remove perl5/
=> Should remove practice/
repnames_nfragments.txt
=> Should remove soft/
=> Should remove songmf/
sort.pbs
test.pbs
test.pbs.o1167575
test.pbs.o1167590
=> Should remove tmp/
=> Should remove wangshx/
=> Should remove workspace/
=> Should remove wt/
=> Should remove wx/
=> Should remove 
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...