Как разобрать файл XML с BeautifulSoup и регулярное выражение в Python - PullRequest
0 голосов
/ 05 марта 2020

У меня есть XML файл, такой как следующий. И я хотел бы разобрать его и заменить каждый экземпляр от \/u\/corpora до /my/datafiles. Ниже приведен мой файл.

<?xml version="1.0" ?>
<corpus name="data_name">
        <speaker-description name="M05">
                <gender>male</gender>
        </speaker-description>
        <recording audio="/u/corpora/BUS.wav" name="BUS">
                <speaker name="M05"/>
                <segment end="inf" name="1" start="0">
                        <orth> WORDS </orth>
                </segment>
        </recording>
        <recording audio="/u/corpora/BUS1.wav" name="BUS1">
                <speaker name="F05"/>
                <segment end="inf" name="1" start="0">
                        <orth> WORDS </orth>
                </segment>
        </recording>

Однако приведенный ниже код дает мне ошибку типа.

from bs4 import BeautifulSoup
import re

_file = BeautifulSoup("/Users/Desktop/my_file.xml")

while re.search(r'\/u\/corpora', _file):
    _file = re.sub(r'\/u\/corpora', r'/my/datafiles', _file)

Как я могу заменить эти шаблоны?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...