Новичок в RegEx - PullRequest
       13

Новичок в RegEx

1 голос
/ 07 июля 2010

У меня есть образец строки:

≪! [If Gte Mso 9]>≪Xml>  ≪Br /> ≪O:Office Document Settings>  ≪Br /> ≪O:Allow Png/>  ≪Br /> ≪/O:Off...

И я хотел бы нацелиться на все, что начинается с "& Lt;" и оканчивается на ">" и заменяет его пробелом "".

Я использую Rubular, но мне сложно научиться его настраивать.

Любые иды?

Ответы [ 4 ]

2 голосов
/ 07 июля 2010

Скороговорка проста:

≪[^>]*>
2 голосов
/ 07 июля 2010
result = subject.gsub(/≪[^>]*>/, '')

должен сделать трюк.

[^>]* означает: соответствует любому количеству символов, кроме >.

0 голосов
/ 08 июля 2010

Похоже, что вы пытаетесь проанализировать XML с помощью регулярных выражений, что является очень сложным и хрупким способом извлечения необходимых вам данных из этого документа.

Возможно, вам лучше разобрать его ивыбор необходимой информации с помощью XPath или DOM.

0 голосов
/ 07 июля 2010

Просто полезный совет, я использую Rubular , чтобы помочь с регулярным выражением при написании отладки.

...