То, как я хотел бы начать, пытаясь получить ту же страницу с помощью веб-браузера.Если вы не можете заставить это работать, вероятно, можно с уверенностью заключить, что настоящая проблема с сервером.Вам нужно будет поговорить со службой поддержки сервера.
Если браузер работает, попробуйте повторить процесс, используя утилиту wget
.Если wget
вызывает у вас проблемы, вернитесь в браузер и выясните, какие именно заголовки браузер отправляет в HTTP-запросе, и попытайтесь заставить wget
использовать те же заголовки.Как только вы получили wget
для работы, запишите заголовки.
Наконец вернитесь к своему Java-коду и измените его так, чтобы отправляемые им заголовки HTTP-запроса были такими же, как те, которые работают дляwget
.
Да, я должен пройти аутентификацию, используя прокси-сервер своего университета, и тогда я смогу получить доступ ко всем данным.Проверка подлинности прокси работает безупречно для «страницы журнала» и даже для других сайтов, поэтому я исключу, что проблема связана с этим.
Я думаю, вы можете исключили реальную проблему.@BalasC не говорит об аутентификации прокси.Скорее он говорит об аутентификации на сайте IEEE.И то, что одна часть сайта работает без аутентификации, еще не значит, что все будет.(Однако я бы подумал, что сайт будет отвечать ошибкой «ЗАПРЕЩЕНО» или «ТРЕБУЕТСЯ АВТОРИЗАЦИЯ», а не доставлять странный контент.)
Другая возможность состоит в том, что сайт пытается предотвратить «скриншот экрана»их содержания с использованием автоматических инструментов.Проверьте «Условия предоставления услуг» для сайта, чтобы увидеть, разрешено ли то, что вы пытаетесь сделать.(Вы можете игнорировать ПС и обойти технические меры, но тогда вы можете обнаружить, что IP-адрес вашей организации или вашей организации заблокирован, или вы можете быть в конце писем о прекращении и отказе от участия в разговоре о нарушении авторских прав.)