В настоящее время я просматриваю список из более 5000 строк, представляющих изображения, которые были представлены отдельным лицам. 113 из этих изображений были повторены. Моя цель сейчас - найти индекс каждого изображения из списка 5000, а также повторение этих изображений (обозначается как rep_). До сих пор я был в состоянии найти индекс для всех изображений и повторяющихся изображений.
Моя цель теперь состоит в том, чтобы прикрепить индексы каждого указанного c изображения вместе с его повторениями к фрейм данных, содержащий список из 113 повторяющихся изображений.
Это функция, которую я использовал для поиска индексов:
def index_of_reps(rep_list, img_labels):
rep_index = []
for i, j in enumerate(img_labels):
for k in rep_list:
if j == k or (j.startswith('rep_') & j.endswith(k,4)):
rep_index = rep_index+[i]
return(rep_index)
Мне нужно как-то изменить это так, чтобы каждый раз, когда он встречал изображение, и его rep_, что список создан для этого изображения и помещен в список списков. После этого я планирую прикрепить его в виде столбца к фрейму данных, который в настоящее время содержит список изображений.
Каков наилучший способ создания этих подсписков с учетом моей текущей функции?