Требуется помощь в разборе текста Java с названием раздела / текстом содержимого - PullRequest
1 голос
/ 09 сентября 2010

У меня есть текст в следующем формате:

название раздела 1:

этот текст входит в первый раздел

название раздела 2:

этот текст переходит во второй раздел

и т.д.

Если названия разделов являются произвольными фразами, а содержимое раздела будет содержать свободный текст, кроме названия раздела. Мне нужно разбить этот текст на пары объектов типа ( имя раздела , текст раздела ).

Существует ли эффективный RegEx или другой рекомендуемый способ сделать это?

Спасибо. -Raj

Ответы [ 2 ]

0 голосов
/ 09 сентября 2010

Ну, это зависит от структуры вашего документа.Например, в каждом разделе есть пустая строка?Если это так, то это будет легко, просто сканируя построчно и просто создавая свой объект таким образом.

0 голосов
/ 09 сентября 2010

Вам потребуется структура или фиксированный идентифицируемый разделитель, чтобы решить, содержит ли строка имя раздела или тело раздела.

Если у вас есть правило, гласящее: текстовая строка, оканчивающаяся двоеточием, является именем раздела , тогда вы должны читать документ построчно, искать последний символ в строке и обрабатывать строку (1) в качестве заголовка раздела, если его последний символ представляет собой двоеточие, или (2) в качестве части тела раздела в противном случае.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...