У меня есть файл, в котором первый столбец является идентификатором, а остальная часть каждой строки содержит от нуля до нескольких цифр, разделенных одним пробелом.
Например:
SOAP.k35.scaffold280 0003723
SOAP.k35.scaffold421
SOAP.k35.scaffold429 0004930 0016021
TRINITY_DN23171_c1_g1_i2 0006457 0005509 0030246 0051082 0005788
SOAP.k35.scaffold599 0007411 0033627 0035001 0016321 0007507 0035011 0007498 0045886 0030155 0030334 0045995 0034446 0005102 0030424 0005604 0030054 0036062 0008021
Я бы хотел, чтобы каждая запись конечных цифр содержалась в отдельной строке с соответствующим идентификатором первого столбца (т. Е. SOAP ... или TRINITY ....)в начале каждой строки добавляется знак «=» между идентификатором первого столбца и указанным номером для этой строки.Я также хотел бы удалить строки, которые не содержат цифр после идентификатора первого столбца.
В качестве примера того, каким должен быть результат обработанного текста выше:
SOAP.k35.scaffold280 = 0003723
SOAP.k35.scaffold429 = 0004930
SOAP.k35.scaffold429 = 0016021
TRINITY_DN23171_c1_g1_i2 = 0006457
TRINITY_DN23171_c1_g1_i2 = 0005509
TRINITY_DN23171_c1_g1_i2 = 0030246
... и т. Д.
Моя основная проблема заключается в знаниикак сохранить этот идентификатор первого столбца для вставки перед любыми символами новой строки, которые я вставляю при разборе строк по числовым данным.
Любая помощь очень ценится.