Я пытаюсь удалить строки в файле, которые начинаются с тех же 5 символов, однако первые 5 символов являются случайными (я не знаю, какими они будут)?
У меня есть код, который читает последние 5 символов первой строки файла и сопоставляет их с ПЕРВЫМИ 5 символами случайной строки в файле, который имеет те же 5 символов. Проблема в том, что когда два или более совпадений имеют одинаковые первые 5 символов, код испортился. Мне нужно что-то, что читает все строки в файле и удаляет одну из двух строк, которые имеют одинаковые 5 первых символов.
Пример (проблема):
CCTGGATGGCTTATATAAGAT***GTTAT***
***GTTAT***ATAATATACCACCGGGCTGCTT
***GTTAT***ATAGTTACAGCGGAGTCTTGTGACTGGCTCGAGTCAAAAT
Что мне нужно в результате после того, как один из них вынут из файла:
CCTGGATGGCTTATATAAGAT***GTTAT***
***GTTAT***ATAATATACCACCGGGCTGCTT
(без третьей строки)
Я был бы очень признателен, если бы вы могли объяснить, как я мог бы поступить так же словами.