Парсинг страниц с продуктами amazon возвращается - PullRequest
0 голосов
/ 25 декабря 2018

Я использовал java для разбора некоторых страниц продуктов Amazon, и это работало отлично до нескольких дней назад.Однако недавно я начал замечать, что Amazon вместо этого возвращает тарабарщину.

Пример (с использованием curl): curl https://www.amazon.in/dp/B00TYK2AZK/

Может кто-нибудь помочь мне с некоторыми указателями на это?Amazon недавно начал использовать какую-либо новую кодировку?

Cheers, Rohitesh

1 Ответ

0 голосов
/ 25 декабря 2018

Я использовал java URLConnection, и это нормально примерно в 4 из 5 запросов.Действительный HTML.Каждый раз, когда возвращается ошибка, код ошибки 503 и используется поток ошибок.Вы проверили код ответа HTTP?

...