Автоопределение каналов данных продукта для произвольного сайта электронной коммерции? - PullRequest
3 голосов
/ 04 марта 2010

Моему веб-приложению необходим доступ к произвольному магазину электронной коммерции и определению, имеет ли оно канал данных о товаре (то есть канал Google Base; канал RSS / ATOM для всех продуктов в магазине). Кроме того, мне нужно извлечь местоположение этого канала.

Лучшее решение, которое я могу придумать, - это вести полный список известных местоположений этих каналов для определенных платформ электронной коммерции и проверять их по одному на сайте, вычеркивая их из списка по мере их возвращения 404 .

Два вопроса:

  1. Можете ли вы придумать лучший подход?
  2. Как мне создать этот список известных местоположений каналов данных о продуктах? По моему опыту, они, как правило, не публикуются (в отличие от RSS-каналов блогов).

Большое спасибо! :)

-Rich

1 Ответ

1 голос
/ 15 марта 2011

Можете ли вы придумать лучший подход?

API пользовательской поисковой системы для поиска каналов. Вы можете попробовать использовать API поиска Google, Bing и Yahoo для поиска каналов товаров на интересующих вас доменах. Это можно сделать следующим образом:

  1. Список форматов общедоступных каналов, которые вас интересуют (например, Google Base, Shopzilla и т. Д.)
  2. Изучите каждую спецификацию фида для поиска уникальных строк.
  3. Создание запросов API поиска, которые возвращают релевантные результаты (ограничение по домену, типу файла и т. Д.).
  4. Проверьте ссылки, которые вы получаете назад для каналов продукта.

Очевидно, это предполагает, что каналы были найдены и проиндексированы поисковыми системами.

Как мне создать этот список известных местоположений каналов данных о продуктах?

Я не верю, что существует такая вещь, как "известное местоположение" для подачи данных о продукте. Однако вы можете попробовать включить в свой алгоритм следующие шаблоны:

  • Шаблоны URL из любых каналов, о которых вы уже знаете.
  • Шаблоны URL, которые вы уже догадались (поставьте себя на место вебмастера и подумайте, как он / она назовет их).
  • Просмотрите документацию по часто используемым программным продуктам eCommerce и плагинам подачи данных о продуктах, чтобы определить их расположение по умолчанию. Включите их шаблоны URL.
...