Получить изображение из RSS XML - PullRequest
0 голосов
/ 13 февраля 2012

Я пытаюсь получить данные из RSS-ленты, но мне трудно получить изображение содержимого / записи блога.Кажется, что тег <img> находится внутри элемента <content:encoded><![CDATA[...]]></content:encoded>.

Я не совсем уверен, что с этим делать.Любая помощь очень ценится.

это выглядит так

<content:encoded><![CDATA[
<p><img class="class1" title="hello world" src="http://www.mysite.com/images/myPhoto.jpg" alt="" width="550" height="227" /></p>
<p><p>Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.</p>
]]></content:encoded>

1 Ответ

0 голосов
/ 13 февраля 2012

Содержимое RSS-канала может быть любым. Многие блоги просто вставляют HTML в контент, поэтому вам придется анализировать HTML, который может каждый раз отличаться.

Для анализа HTML вы можете превратить его в XHTML, а затем использовать XPath для запроса элементов, которые вы хотите найти.

Если вам нужна дополнительная помощь, вам нужно опубликовать структуру контента (если она известна)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...