Я получаю текстовый файл из моего источника, который имеет содержание ниже в одну строку.
<employees><employee><id>101</id><name>Lokesh Gupta</name><title>Author</title></employee><employee><id>102</id><name>Brian Lara</name><title>Cricketer</title></employee></employees>
В моем коде я должен читать данные каждого сотрудника как String. Например: <employee><id>101</id><name>Lokesh Gupta</name><title>Author</title></employee>
как строка и <employee><id>102</id><name>Brian Lara</name><title>Cricketer</title></employee>
как другая строка. Когда я печатаю содержимое на консоли, оно должно печатать <employee><id>101</id><name>Lokesh Gupta</name><title>Author</title></employee>
. Не могли бы вы дать мне знать, как это сделать?
Как правило, файл, который я получаю из моего источника, состоит из более 100 миллионов сведений о сотруднике в одну строку, и я должен прочитать все эти данные сотрудника в виде отдельной строки и сохранить их в другом файле. Поскольку размер файла огромен, я попытался использовать анализатор SAX, и с этим я могу анализировать содержимое XML, но не могу прочитать все данные в виде строки.
Я пытался использовать SAX Parser и обработчик по умолчанию для чтения этого содержимого. Но в методах startElement и EndElement мне нужно написать свою логику для добавления <
и >
, <
и />
соответственно. Я хочу узнать лучший способ прочтения этого текста вместо написания логики для добавления угловых скобок.