В моем проекте мне нужно перебирать файлы, используя Java.Идея этого заключается в обработке данных генома и выводе их в новый файл.
Вот пример из пары строк данных, которые мы должны пройти:
cure for cancer protein
ATGCCACTATGGTAG
captain picard hair growth protein
ATgCCAACATGgATGCCcGATAtGGATTgA
bogus protein
CCATt-AATgATCa-CAGTt
Я борюсьо том, как можно логически расшифровать имя региона («лекарство от ракового белка») и следующую последовательность символов.Я могу заставить файл отображать всю информацию легко, но мне нужно обрабатывать последовательность символов иначе, чем имя региона, и я не могу понять, как логически определить, является ли строка именем региона или последовательностью.
Любая помощь будет принята с благодарностью.