У меня есть файл, который выглядит так (но намного больше):
>some text
ABC
DEF
GHI
>some more text
JKL
MNO
PQR
Я какое-то время играл с ним в Java и смог построить массивы со строками и т. Д. Строки с '>' обычно представляют собой одну строку, но иногда могут быть 2, 3 или более строк. Строки, которые не начинаются с «>», имеют одинаковую длину в символах, но их может быть 10, 20 или 30 или более. Сейчас я нахожусь в точке, где я хочу создать массив строк, где каждая строка в массиве содержит строку строк, которые не начинаются с '>', например:
array element 1 = ABCDEFGHI
array element 2 = JKLMONPQR
Я чувствую, что я близко, но мне нужен небольшой удар в зад, чтобы заставить меня двигаться. Я уверен, что это легко для профессионала, но я все еще новичок в Java.
Конкретная проблема связана с другими постами, которые я сделал на этой доске. Это файл FASTA:
>3BHS_BOVIN (P14893) 3 beta-hydroxysteroid
AGWSCLVTGGGGFLGQRIICLLVEEKDLQEIRVLDKVFRPEVREEFSKLQSKIKLTLLEG
DILDEQCLKGACQGTSVVIHTASVIDVRNAVPRETIMNVNVKGTQLLLEACVQASVPVFI
>41_BOVIN (Q9N179) Protein 4.1
MHCKVSLLDDTVYECVVEKHAKGQDLLKRVCEHLNLLEEDYFGLAIWDNATSKTWLDSAK
EIKKQVRGVPWNFTFNVKFYPPDPAQLTEDITRYYLCLQLRQDIVSGRLPCSFATLALLG
SYTIQSELGDYDPELHGADYVSDFKLAPNQTKELEEKVMELHKSYRSMTPAQADLEFLEN
>5NTD_BOVIN (Q05927) 5'-nucleotidase
MNPGAARTPALRILPLGALLWPAARPWELTILHTNDVHSRLEQTSEDSSKCVNASRCVGG
VARLATKVHQIRRAEPHVLLLDAGDQYQGTIWFTVYKGTEVAHFMNALGYESMALGNHEF
DNGVEGLIDPLLKEVNFPILSANIKAKGPLASKISGLYSPYKILTVGDEVVGIVGYTSKE
TPFLSNPGTNLVFEDEITALQPEVDKLKTLNVNKIIALGHSGFEVDKLIAQKVKGVDVVV
Мне в конечном итоге нужны последовательности в их собственном элементе массива, чтобы я мог ими манипулировать позже.