У меня есть текстовый файл, который содержит содержимое, скопированное с веб-страниц.Текстовый файл структурирован следующим образом:
| NEWTAB | lkfalskdjlskjdflsj | NEWTAB | lkjsldkjslkdjf | NEWTAB | sdlfkjsldkjf | NEWLINE | lksjlkjsdl | NEWTAB | lkjlkjlkj | NEWTAB | sdkjlkjsld
1004 * | NEWLINE |указывает начало новой строки (т. е. новой строки в данных) | NEWTAB |указывает начало нового поля в строке (т. е. новый столбец в данных)
Мне нужно разбить текстовый файл на поля и строки и сохранить их в массиве или какой-либо другой структуре данных.Контент между | NEWLINE |строки могут содержать фактические новые строки (т.е. \ n), но они не указывают на фактическую новую строку в данных.
Я начал с чтения каждого символа по одному и просмотра наборов из 8 последовательных символовчтобы увидеть, если они содержали | NEWTAB |.Мой метод оказался ненадежным и безобразным.Я ищу лучшую практику по этому вопросу.Будет ли лучший способ прочитать весь текстовый файл как одну строку, а затем использовать строку, разделенную на "| NEWLINE |"и затем строка разбивается на результирующие строки, используя "| NEWTAB |"?
Большое спасибо!