Перечислите функцию с похожими строками в списке - PullRequest
0 голосов
/ 05 марта 2020

Написание скрипта для чтения нескольких CSV-файлов. У меня есть список из 3 различных штрих-кодов. Каждый код имеет три разных файла. Каждый код имеет одинаковый префикс «5SvF9yM6ldXGRpBz». Это часть более длинных списков штрих-кодов.

У меня есть еще один список каталогов, в которых найдены штрих-коды. Чтобы запустить скрипт, мне нужны все три файла

Моя цель - создать словарь из различных штрих-кодов и каталогов. У меня проблема с выводом. Один из трех штрих-кодов отсутствует. '5SvF9yM6ldXGRpBz1. Я думаю, что проблема с функцией перечисления в for l oop.

 directories = ['C:/Desktop/5SvF9yM6ldXGRpBz1_FIRST.csv',
'C:/Desktop/5SvF9yM6ldXGRpBz11_FIRST.csv',
'C:/Desktop/5SvF9yM6ldXGRpBz12_FIRST.csv',
'C:/Desktop/5SvF9yM6ldXGRpBz1_SECOND.csv',
'C:/Desktop/5SvF9yM6ldXGRpBz11_SECOND.csv',
'C:/Desktop/5SvF9yM6ldXGRpBz12_SECOND.csv',
'C:/Desktop/5SvF9yM6ldXGRpBz1_THIRD.csv',
'C:/Desktop/5SvF9yM6ldXGRpBz11_THIRD.csv',
'C:/Desktop/5SvF9yM6ldXGRpBz12_THIRD.csv']

barcodes = ['5SvF9yM6ldXGRpBz1',
'5SvF9yM6ldXGRpBz11',
'5SvF9yM6ldXGRpBz12',
'5SvF9yM6ldXGRpBz1',
'5SvF9yM6ldXGRpBz11',
'5SvF9yM6ldXGRpBz12',
'5SvF9yM6ldXGRpBz1',
'5SvF9yM6ldXGRpBz11',
'5SvF9yM6ldXGRpBz12']

#print(directories)
#print(barcodes)

barcodes = list(set(barcodes))
barcodes = [s for s in barcodes if "5SvF9yM6ldXGRpBz" in s] #Want to process codes with this prefix 
directories = list(set(directories))
#print(directories)
directories = [s for s in directories if "5SvF9yM6ldXGRpBz" in s]
#print(directories)

barcode_dirs_indexes =[]
for b_code in barcodes:
   #print(b_code)
   index = [i for i,x in enumerate(directories) if b_code in x] #I think the issue is here
   barcode_dirs_indexes.append(index)
   #print(barcode_dirs_indexes)

barcode_dirs = [[directories[x] for x in y] for y in barcode_dirs_indexes]

# only process barcode with 3 directories, i.e. the barcode has 3 files 
data_barcode_dir_indx = [i for i,x  in enumerate(barcode_dirs) if len(x) == 3 ]
data_barcode_dirs = [x for x in barcode_dirs if len(x) == 3]
#print(data_barcode_dir_indx)
#print(data_barcode_dirs)
complete_data_barcodes = [barcodes[x] for x in data_barcode_dir_indx]
print(complete_data_barcodes)
dir_file_dict = dict(zip(complete_data_barcodes, data_barcode_dirs)) 

Вывод dir_file_dict: отсутствует штрих-код: 5SvF9yM6ldXGRpBz1

{'5SvF9yM6ldXGRpBz12': ['C:/Desktop/5SvF9yM6ldXGRpBz12_FIRST.csv', 
'C:/Desktop/5SvF9yM6ldXGRpBz12_THIRD.csv', 'C:/Desktop/5SvF9yM6ldXGRpBz12_SECOND.csv'], 
'5SvF9yM6ldXGRpBz11': ['C:/Desktop/5SvF9yM6ldXGRpBz11_FIRST.csv', 
'C:/Desktop/5SvF9yM6ldXGRpBz11_SECOND.csv', 'C:/Desktop/5SvF9yM6ldXGRpBz11_THIRD.csv']}

1 Ответ

1 голос
/ 05 марта 2020

Вы можете сделать:

d = {}
for i,j in zip(barcodes, directories):
  if not d.get(i):
    d[i] = []
  d[i].append(j)

print(d)
...