У меня есть файл с разделителями табуляции, который выглядит примерно так:
\>WB02 \t F27C8.1
IV \t B-9641
\>WB03 \t F07C3.7
\>WB04 \t F52H2.2
\>WB04 \t F52H2.2
\>WB05 \t T13A10.10
IV \t B-15643
IV \t B-11650
IV \t B-13649
Используя python, я хотел бы связать информацию из строк, начинающихся с «>», с информацией из любых последующих строк, поэтому не начинайте с «>». Каждый раз, когда есть строка «>», за которой следует строка, отличная от «>», я хотел бы напечатать значение столбца 2 из строки «>», затем вкладку, а затем значение столбца 2 из не> ' линия. Например:
F27C8.1 \t B-9641
T13A10.10 \t B-15643
T13A10.10 \t B-11650
T13A10.10 \t B-13649
К настоящему времени я написал сценарии, которые читают файлы построчно. В этом случае мне нужно будет прочитать весь файл в память? Входной файл не будет превышать 30K строк, всего около 10 МБ. После этого я предполагаю, что я начну с чего-то вроде «Для каждой строки, которая не начинается с«> », получить значение из столбца 2 ближайшей предыдущей строки, которая начинается с«> ». Я был бы признателен за любые указатели в правильном направлении для чтения - это немного сложнее, чем все, что я делал до сих пор (детские шаги!).