HttpClient не может 302 эту ссылку? - PullRequest
       149

HttpClient не может 302 эту ссылку?

0 голосов
/ 08 сентября 2010

Я нашел URL, на котором httpclient, кажется, не обрабатывает перенаправления:

http://news.google.com/news/url?sa=t&fd=R&usg=AFQjCNGrJk-F7Dmshmtze2yhifxRsv8sRg&url=http://www.mtv.com/news/articles/1647243/20100907/story.jhtml

должен 302: http://www.mtv.com/news/articles/1647243/20100907/story.jhtml

, когда я смотрюв заголовках браузера все выглядит хорошо:

HTTP/1.1 302 Moved Temporarily
Content-Type: text/html; charset=UTF-8
Location: http://www.mtv.com/news/articles/1647243/20100907/story.jhtml
Content-Length: 258
Date: Wed, 08 Sep 2010 18:40:21 GMT
Expires: Wed, 08 Sep 2010 18:40:21 GMT
Cache-Control: private, max-age=0
X-Content-Type-Options: nosniff
X-Frame-Options: SAMEORIGIN
X-Xss-Protection: 1; mode=block
Server: GSE
Set-Cookie: PREF=ID=024209255b405b06:TM=1283971221:LM=1283971221:S=AG-13_7Cjg_EqlRY; expires=Fri, 07-Sep-2012 18:40:21 GMT; path=/; domain=.google.com
Connection: close

Однако httpclient, похоже, не дает мне окончательный URL.Вот код, который я использовал

HttpHead httpget = null;
HttpHost target = null;
HttpUriRequest req = null;

String startURL = "http://news.google.com/news/url?sa=t&fd=R&usg=AFQjCNGrJk-F7Dmshmtze2yhifxRsv8sRg&url=http://www.mtv.com/news/articles/1647243/20100907/story.jhtml";
HttpContext localContext = new BasicHttpContext();
localContext.setAttribute(ClientContext.COOKIE_STORE,HttpClientFetcher.emptyCookieStore);
httpget = new HttpHead(startURL);

HttpResponse response = httpClient.execute(httpget, localContext);

Header[] test = response.getAllHeaders();
for(Header h: test) {
logger.info(h.getName()+ ": "+h.getValue());
}

target = (HttpHost) localContext.getAttribute( ExecutionContext.HTTP_TARGET_HOST );

req = (HttpUriRequest) localContext.getAttribute( ExecutionContext.HTTP_REQUEST );

// STILL PRINTS OUT THE GOOGLE NEWS LINK
finalURL = target+""+req.getURI();

Я что-то не так делаю?спасибо

1 Ответ

0 голосов
/ 08 сентября 2010

Нашел ответ из списка рассылки httpclient ...

Google не обрабатывает HEAD и GET одинаково, поэтому GET перенаправляет с 302, а запрос HEAD выдает 200 OK

...