Удалить контент из ленты wordpress.com с помощью Yahoo труб - PullRequest
0 голосов
/ 01 сентября 2010

Я использую каналы Yahoo, чтобы получить контент, соответствующий определенной категории, из моего блога WordPress.com.Все работает нормально, но WordPress добавляет ссылки «поделиться» внизу ленты, которые я хотел бы удалить.

Вот что добавляется:

<a rel="nofollow" target="_blank" href="http://feeds.wordpress.com/1.0/gocomments/bandonrandon.wordpress.com/87/">
    <img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/bandonrandon.wordpress.com/87/"/></a>
    <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=bandonrandon.wordpress.com&blog=1046814&post=87&subd=bandonrandon&ref=&feed=1" width="1" height="1"/>

Я отредактировал некоторые службы, но вы поняли идею.Я пытался использовать регулярные выражения для удаления этого содержимого, то, что я пытался сделать так:

<a rel="nofollow" target="_blank" href="http://feeds.wordpress.com/.*?><img alt="" border="0" src="http://feeds.wordpress.com.*?></a>

и

<img alt="" border="0" src="http://stats.wordpress.com.*?>

, однако он не фильтровал результаты вообще.Использование этого будет фильтровать все изображения и работает нормально

<a.*?><img.*?></a>

1 Ответ

1 голос
/ 01 сентября 2010
<a[^>]+href="http://feeds.wordpress.com[^"]*"[^>]*>\s*<img[^>]+src="http://feeds.wordpress.com/[^"]*"[^>]*>\s*</a>\s*<img[^>]+src="http://stats.wordpress.com/[^"]*"[^>]*>

Regex обновлено, попробуйте это, чтобы соответствовать всему лоту.

...