Как можно развернуть короткий URL-адрес «4sq.com/xCMa****» до полного реального URL-адреса «foursquare.com/someone/checkin/4f5d****» - PullRequest
1 голос
/ 13 марта 2012

В настоящее время я работаю над исследовательским проектом, который должен собирать твиты регистрации из Twitter.

Создан сканер, и полученные твиты представлены в следующем формате: "Я нахожусь на ГДЕ-ТО 4sq.com/xW1q**"

При нажатии на ссылку «4sq.com/xW1q**», страница будет перенаправлена ​​на URL-адрес, например «foursquare.com/SOMEONE/checkin/CHECKINID&SIGNATURE» ». Мне нужно извлечь CHECKINID и ПОДПИСЬ, чтобы получить подробную информацию о регистрации.

Я хочу спросить, как я могу запрограммировать развернуть более короткий URL-адрес на более длинный URL-адрес для получения идентификатора регистрации и подписи? Кто-то предлагает мне сделать запрос HEAD , чтобы получить полный URL, но я не знаю, как это сделать.

Заранее спасибо.

1 Ответ

0 голосов
/ 13 марта 2012

Новый более правильный ответ

4sq.com использует bit.ly для сокращения URL-адресов, поэтому вы должны использовать API-интерфейс bit.ly для расширения URL-адреса: http://code.google.com/p/bitly-api/wiki/ApiDocumentation

Запрос HEAD является правильным решением.

Чтобы выполнить запрос HEAD в curl:

curl -i -X HEAD http://4sq.com/abcdefg

, который возвращает заголовки следующим образом:

HTTP/1.1 301 Moved
Server: nginx
Date: Tue, 13 Mar 2012 14:26:02 GMT
Content-Type: text/html; charset=utf-8
...other headers...
Location: <<<FULL URL>>>

Если вы расскажете нам больше о том, на каком языке вы кодируете, мы можем дать вам более конкретный совет о том, как сделать запрос HEAD и получить значение заголовка.

...