Удаление разметки при работе сive - PullRequest
3 голосов
/ 20 июня 2011

Я учусь использовать фантастическую оживляющую библиотеку, чтобы заняться веб-скребком.Мне нужно захватить некоторый текст, который может быть частично выделен.Например, HTML может выглядеть следующим образом:

<a href="example.com" class="usefulLink"><font color="#CC0000">Foo</font> <font color="#CC0000">Bar</font> <font color="#CC0000">Baz</font> <font color="#CC0000">Blah</font>rest of text</a>

Результат при использовании (выберите страницу [: a.usefulLink]) много {:tag :font :attrs {...} :content {...}}

Мой вопрос: есть липростой способ выловить контент: контент без всего остального ненужного, или мне нужно сделать это самому?

1 Ответ

7 голосов
/ 20 июня 2011

Вы можете использовать unwrap.

(-> page
  (select [:a.usefulLink])
  (at [:font] unwrap))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...