Как получить данные для BeautifulSoup Xml Parser - PullRequest
0 голосов
/ 21 июня 2010

Я пытаюсь разобрать файл XML с BeautifulSoup. Во всех уроках в сети содержание XML указано как

xml = "<doc><tag1>Contents 1<tag2>Contents 2<tag1>Contents 3"
soup = BeautifulStoneSoup(xml)

но я хочу указать только путь к XML-файлу. В механизме можно использовать метод get_data (), но он работает только для HTML-файлов. Любые предложения?

1 Ответ

0 голосов
/ 21 июня 2010

Документация BeautifulSoup гласит:

"Конструктор Beautiful Soup принимает документ XML или HTML в виде строки (или открытый объект, похожий на файл). Он анализируетдокумент и создает соответствующую структуру данных в памяти. "

При формулировании вопроса вы используете BeautifulStoneSoup, и, хотя в онлайн-документации используются строки, строка документа для конструктора показывает, что:

«Объект Soup инициализируется как« корневой тег », и предоставленная разметка (которая может быть строкой или файловым объектом) передается в базовый синтаксический анализатор."

...