RSS-лента новостей Google - - PullRequest
       51

RSS-лента новостей Google -

0 голосов
/ 05 апреля 2011

Пытаясь получить только текстовое описание из этой хорошей новостной ленты, я не хочу HTML, но не могу найти общий способ его выделить ..

http://news.google.co.uk/news?pz=1&cf=all&ned=uk&hl=en&as_scoring=r&as_maxm=4&q=web+design&as_qdr=a&as_drrb=q&as_mind=6&as_minm=3&cf=all&as_maxd=5&output=rss

1 Ответ

1 голос
/ 05 апреля 2011

Если вы знаете, как получить данные HTML из правильного XML-элемента (в данном случае <description>), вы можете просто удалить весь HTML с помощью PHP strip_tags

Кажется, это работает так, как вы хотите:

$news = simplexml_load_file('http://news.google.co.uk/news?pz=1&cf=all&ned=uk&hl=en&as_scoring=r&as_maxm=4&q=web+design&as_qdr=a&as_drrb=q&as_mind=6&as_minm=3&cf=all&as_maxd=5&output=rss');

foreach($news->channel->item as $item) {
    echo $item->title . "\n";
    echo strip_tags($item->description) ."\n";
} 
...