сопоставлять объекты XML в reqex, используя xml :: dom - PullRequest
0 голосов
/ 28 июля 2011

У меня есть скрипт, который перебирает все текстовые узлы в XML-файле (используя xml :: dom), а затем объединяет их с reqex.Я не могу сопоставить текст, например:

§ 1-101

Я не могу сопоставить с регулярным выражением, например

my $match =~ qr/((?:\&\#xa7;\&\#x2009\;)?(?:\d+\-\d{3}))/;

, все работает нормально, когда я опускаю сущности... мое лучшее (ограниченное) предположение состоит в том, что сущности - это не простой текст, и мне нужен код, чтобы либо сгладить сущности в простой текст, либо как-то обработать сущности.Каков наилучший способ решить эту проблему?

1 Ответ

0 голосов
/ 29 июля 2011

XML :: DOM :: Node имеет нестандартный метод expandEntityRefs (), который разворачивает их в открытый текст.В противном случае HTML :: Entities также может быть достаточно хорошим для вашего использования.

...