В настоящее время я работаю с третьей стороной, которая предоставляет нам информацию о продукте в ленте RSS.
Наш сайт Drupal 6 импортирует из каждого канала (по существу, категории) новости RSS (продукты) и отображает полученные узлы на страницах нашего магазина. Для этого мы используем модуль Feeds.
Пока все хорошо, и эта система работает уже больше года.
У меня вопрос: как мне извлечь больше содержимого RSS-канала?
Я имею в виду, что на данный момент цены являются частью канала, но наш сайт не имеет цены в качестве сущности в базе данных, он просто имеет каплю HTML.
Я хочу, чтобы цена была в специальном поле CCK, чтобы мы могли быть немного более умными в том, как мы перечисляем вещи и так далее.
Я никогда не выходил за рамки тематики Drupal, но я чувствую себя комфортно с PHP / XPath / DOM, поэтому я уверен, что это возможно, если я смогу просто разобраться, как подключать и анализировать HTML-содержимое накорми себя.
Вместо того, чтобы взламывать что-то вместе, что может быть неоптимальным, кто-нибудь может подсказать, как лучше мне это сделать? Пользовательский модуль Feed Feed? Какой-то другой хук в Drupal, который обрабатывает узлы?
Edit:
Чтобы уточнить, мы в настоящее время используем модуль Feeds (6.x-1.0-beta) и отображаем заголовок RSS, описание, дату и т. Д. В поля CCK.
Я хотел бы сделать еще один шаг и проанализировать HTML-содержимое поля «описание» RSS.
Обновление:
http://drupal.org/project/feedapi_scraper
Это похоже на то, что мне нужно, но не выглядит широко используемым, что всегда заставляет меня немного нервничать с модулями Drupal. Я попробую и доложу.