В основном я хочу разделить документ словами между кавычками. Я новичок с регулярным выражением, и даже после использования Rubular я не приблизился к ответу.
Любая помощь приветствуется.
Используйте анализатор HTML и забудьте о регулярных выражениях. Regex не способен правильно обрабатывать HTML.
doc = Nokogiri::HTML(your_html) doc.xpath("//blockquote").remove
От: Удаление текста из документа HTML с использованием Ruby
Есть и другие примеры использования Nokogiri и XPath, если вы посмотрите вокруг.
Пример строки:
Привет, мир
введите следующее регулярное выражение в рублевом выражении
(. +?)
или для чего-то более общего:
<. *?> (. +?) </.*?>
надеюсь, это поможет!
необработанный пример:
/<blockquote>([^<]*)<\/blockquote>/