У меня есть большой файл с записями, открытыми в python как:
fh_in=open('/xzy/abc', 'r')
parsed_in=csv.reader(fh_in, delimiter=',')
for element in parsed_in:
print(element)
РЕЗУЛЬТАТ:
['ABC', 'chr9', '3468582', 'NAME1','UGA', 'GGU']
['DEF', 'chr9', '14855289', NAME19 ',' UCG ',' GUC ']
[' TTC ','chr9 ',' 793946 ',' NAME178 ',' CAG ',' GUC ']
[' ABC ',' chr9 ',' 3468582 ',' NAME272 ',' UGT ',' GCU ']
Мне нужно извлечь только уникальные записи и удалить записи с одинаковыми значениями в col1, col2 и col3.Как и в этом случае, последняя строка совпадает со строкой 1 на основе col1, col2 и col3.
Я пробовал два метода, но не смог:
Метод 1:
outlist=[]
for element in parsed_in:
if element[0:3] not in outlist[0:3]:
outlist.append(element)
Метод 2:
outlist=[]
parsed_list=list(parsed_in)
for element in range(0,len(parsed_list)):
if parsed_list[element] not in parsed_list[element+1:]:
outlist.append(parsed_list[element])
Они оба возвращают все записи, а не уникальные записи на основе первых 3 столбцов.
Пожалуйста, предложите мне способ сделать это
AK