Обработка RSS-ленты в Drupal - PullRequest
       50

Обработка RSS-ленты в Drupal

0 голосов
/ 17 октября 2011

В настоящее время я работаю с третьей стороной, которая предоставляет нам информацию о продукте в ленте RSS.

Наш сайт Drupal 6 импортирует из каждого канала (по существу, категории) новости RSS (продукты) и отображает полученные узлы на страницах нашего магазина. Для этого мы используем модуль Feeds.

Пока все хорошо, и эта система работает уже больше года.

У меня вопрос: как мне извлечь больше содержимого RSS-канала?

Я имею в виду, что на данный момент цены являются частью канала, но наш сайт не имеет цены в качестве сущности в базе данных, он просто имеет каплю HTML.

Я хочу, чтобы цена была в специальном поле CCK, чтобы мы могли быть немного более умными в том, как мы перечисляем вещи и так далее.

Я никогда не выходил за рамки тематики Drupal, но я чувствую себя комфортно с PHP / XPath / DOM, поэтому я уверен, что это возможно, если я смогу просто разобраться, как подключать и анализировать HTML-содержимое накорми себя.

Вместо того, чтобы взламывать что-то вместе, что может быть неоптимальным, кто-нибудь может подсказать, как лучше мне это сделать? Пользовательский модуль Feed Feed? Какой-то другой хук в Drupal, который обрабатывает узлы?

Edit:

Чтобы уточнить, мы в настоящее время используем модуль Feeds (6.x-1.0-beta) и отображаем заголовок RSS, описание, дату и т. Д. В поля CCK.

Я хотел бы сделать еще один шаг и проанализировать HTML-содержимое поля «описание» RSS.

Обновление:

http://drupal.org/project/feedapi_scraper

Это похоже на то, что мне нужно, но не выглядит широко используемым, что всегда заставляет меня немного нервничать с модулями Drupal. Я попробую и доложу.

Ответы [ 2 ]

0 голосов
/ 19 октября 2011

Похоже, хорошим решением является этот модуль:

http://drupal.org/project/feeds_xpathparser

Он поддерживает использование произвольных XPath для извлечения информации из ваших исходных каналов.

0 голосов
/ 17 октября 2011

Я почти уверен, что Модуль Mapper * сделает все за вас: -)

со страницы модуля:

Дополнительный модуль для FeedAPI, который отображает элементы в элементе ленты, такие как теги или имя автора, в поля таксономии или CCK. Эти сопоставления настраиваются с помощью точки и щелчка.
...