Я использовал java для разбора некоторых страниц продуктов Amazon, и это работало отлично до нескольких дней назад.Однако недавно я начал замечать, что Amazon вместо этого возвращает тарабарщину.
Пример (с использованием curl): curl https://www.amazon.in/dp/B00TYK2AZK/
Может кто-нибудь помочь мне с некоторыми указателями на это?Amazon недавно начал использовать какую-либо новую кодировку?
Cheers, Rohitesh
Я использовал java URLConnection, и это нормально примерно в 4 из 5 запросов.Действительный HTML.Каждый раз, когда возвращается ошибка, код ошибки 503 и используется поток ошибок.Вы проверили код ответа HTTP?