У меня есть файл с заголовком (обозначенным '>'), за которым следует текст на следующей строке.Мне нужно захватить группы, которые содержат одинаковые номера в заголовке.В приведенном ниже примере текста я хотел бы напечатать первые четыре строки (оба заголовка содержат «4471») в один файл, а последние четыре строки (заголовки содержат «4527») - в другой файл.
>VUSY-4471
AAAGTAATTCAGGATGAAGAGAGACTGCT
>XFJG-4471
AATGTTATTCAAGATGAAGATAGGTTGCTGGCTGCA
>Ambtr-4527
GAGGAGCGGGTGATTGCCTTGGTCGTTGGTGGTGG
>Arath-4527
GAAGAGAGAGTGAATGTTCTTGTA
Следующее регулярное выражение успешно захватывает группы текста при тестировании в текстовом редакторе (см. Скриншот), но я не могу заставить его работать в скрипте Python.Любая помощь будет принята с благодарностью !!
>.+?-(\d+)[\S\s]+>.+-\1\n.+
Пример захваченного текста 