Регулярное выражение для совпадения слов между <blockquote>& </blockquote> - PullRequest
1 голос
/ 19 апреля 2010

В основном я хочу разделить документ словами между кавычками. Я новичок с регулярным выражением, и даже после использования Rubular я не приблизился к ответу.

Любая помощь приветствуется.

Ответы [ 3 ]

10 голосов
/ 19 апреля 2010

Используйте анализатор HTML и забудьте о регулярных выражениях. Regex не способен правильно обрабатывать HTML.

doc = Nokogiri::HTML(your_html)
doc.xpath("//blockquote").remove

От: Удаление текста из документа HTML с использованием Ruby

Есть и другие примеры использования Nokogiri и XPath, если вы посмотрите вокруг.

0 голосов
/ 19 апреля 2010

Пример строки:

Привет, мир

введите следующее регулярное выражение в рублевом выражении

(. +?)

или для чего-то более общего:

<. *?> (. +?) </.*?>

надеюсь, это поможет!

0 голосов
/ 19 апреля 2010

необработанный пример:

/<blockquote>([^<]*)<\/blockquote>/
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...