Так что я должен разобрать уродливые файлы, которые содержат вложенные теги, такие как
<p>blah<strong>lah</strong>blah</p>
Вложенные теги определены, и мне плевать на них. Но они делают XmlPullParser неудачным:
XmlPullParser parser = XmlPullParserFactory.newInstance().newPullParser();
parser.setInput(some_reader);
while (parser.next() != XmlPullParser.END_DOCUMENT) {
if (XmlPullParser.START_TAG == event) {
String tag = parser.getName();
if (tag != null) {
tag = tag.toLowerCase();
} else {
continue;
}
if ("p".equals(tag)) {
String text = parser.nextText();
// and here we go
// org.xmlpull.v1.XmlPullParserException: expected: /p read: strong
}
}
}
Вопрос: есть ли шанс уйти без предварительной обработки файла, удалив все ненужные теги или используя стороннюю библиотеку?
EDIT:
Обновлен фрагмент, чтобы он действительно имел смысл.