Python readlines не разделяет строки - PullRequest
0 голосов
/ 03 июля 2011

У меня есть XML-файл со страницы, который правильно отображается в текстовом редакторе, но как только я использую readlines (), я получаю только одну строку. Я предполагаю, что это означает, что используемый разделитель строк не распознается Python, но это Gedit.

Я хочу сделать на нем split (), чтобы правильно получить данные, но как я могу узнать, какой разделитель строк используется в файле?

1 Ответ

0 голосов
/ 03 июля 2011

Как указано в комментариях, если это xml, просто передайте его в XML-парсер, такой как ElementTree или lxml. Новые строки не должны иметь значения в XML.

Для информации, использование open("thefile.xml", "rU") откроет его с универсальной поддержкой новой строки, поэтому Python распознает \n, \r или \r\n как маркеры новой строки.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...