У меня есть гигантский текстовый файл (около 1,5 гигабайт) с XML-данными в нем. Весь текст в файле находится в одной строке и пытается открыть его в любом текстовом редакторе (даже упомянутом в этой теме: Текстовый редактор для открытия больших (гигантских, огромных, больших) текстовых файлов ) либо ужасно дает сбой, либо полностью непригоден из-за зависания текстового редактора при попытке прокрутки.
Я надеялся ввести в файл символы новой строки, используя следующую команду sed
sed 's/>/>\n/g' data.xml > data_with_newlines.xml
К сожалению, это привело к тому, что sed дал мне ошибку сегментации. Из того, что я понимаю, sed читает файл построчно, что в данном случае означает, что он пытается прочитать весь 1,5-гигабайтный файл в одну строку, что наверняка объяснит segfault. Однако проблема остается.
Как ввести новые строки после каждого> в XML-файле? Нужно ли прибегать к написанию небольшой программы, чтобы сделать это для меня, читая файл символ за символом?