Как получить информацию о продукте от Amazon, основываясь только на URL? - PullRequest
3 голосов
/ 23 мая 2009

У меня просто есть ссылка на страницу продукта на Amazon. Как получить всю информацию (фото, цену и т. Д.) В моей программе ruby, просто воспользовавшись этой ссылкой?

Ответы [ 5 ]

7 голосов
/ 17 ноября 2011

Вот список поддерживаемых URL-адресов, представленных amazon для их oembed, API рекламы продукта появится на экране только после анализа этих URL-адресов и получения ASIN

http://amazon./gp/product/*

http://amazon.//dp/

http://amazon./dp/*

http://amazon./o/ASIN/*

http://amazon./gp/offer-listing/*

http://amazon.//ASIN/

http://amazon./gp/product/images/*

http://amazon./gp/aw/d/*

http://www.amzn.com/*

http://amzn.com/*

2 голосов
/ 23 мая 2009

Я нашел эту библиотеку (я использую Rails) амазонки-ЭКС Я экспериментирую с этим. Тем не менее, я бы потребовал какой-то идентификатор (идентификатор продукта?), Чтобы получить подробную информацию о конкретном продукте. Например, рассмотрите эту ссылку, чтобы разжечь

http://www.amazon.com/Kindle-Amazons-Wireless-Reading-Generation/dp/B00154JDAI/ref=amb_link_84372271_1?pf_rd_m=ATVPDKIKX0DER&pf_rd_s=center-1&pf_rd_r=06JJGQP9J3BHKPE38SXP&pf_rd_t=101&pf_rd_p=478184871&pf_rd_i=507846

В этой ссылке я заметил ASIN, то есть B00154JDAI.

Похоже, я могу использовать этот идентификатор для получения информации о продукте (используя amazon-ecs). Мне просто нужно разобрать URL, чтобы получить ASIN.

Есть ли другой способ сделать это?

Нет, я не собираюсь снимать с экрана, это не очень хорошая идея в любое время.

1 голос
/ 23 мая 2009

Если вы хотите это сделать, библиотеки Nokogiri или hpricot позволяют выполнять разбор HTML и поиск. Тем не менее, этот вид очистки экрана общеизвестно ненадежен (так как он может сломаться в любое время, когда Amazon решит реорганизовать свой HTML), поэтому, если вы планируете делать такие вещи в течение любого периода времени, я бы порекомендовал использовать 1005 * API рекламы продуктов Amazon вместо.

0 голосов
/ 26 мая 2009

Вы должны использовать библиотеку Ruby / AWS (Google для этого, моя карма недостаточно высока, чтобы разрешить внешние ссылки ...) Это было написано именно для этого.

Возможно, вам понадобится встроенный Поиск, чтобы найти искомый предмет. После этого API предоставляет доступ к изображениям, ссылкам и всей полезной информации.

0 голосов
/ 23 мая 2009

В вашей программе: загрузите страницу и проанализируйте HTML. Отфильтруйте необходимую информацию. В Ruby могут быть библиотеки (о которых я не знаю), которые разбирают HTML.

hpricot , кажется, делает то, что вы хотите.

...