Сканирование itunes.apple.com - PullRequest
       5

Сканирование itunes.apple.com

0 голосов
/ 03 августа 2010

Я пытаюсь сканировать веб-сайт apple itunes.Я получаю вывод в двоичном формате.Например,

curl -A "mozilla / 5.0" http://itunes.apple.com/us/app/the-far-islands-by-john-buchan/id327765949?mt=8

возвращает двоичный файл.

Может кто-нибудь сказать, что мне не хватает?

Спасибо

1 Ответ

1 голос
/ 03 августа 2010

Вы получаете двоичный код обратно, потому что цитируемая вами страница не возвращает HTML / XML, а возвращает Apple WebObject.От wget:

wget http://itunes.apple.com/us/app/the-far-islands-by-john-buchan/id327765949?mt=8
--2010-08-03 12:38:14--  http://itunes.apple.com/us/app/the-far-islands-by-john-buchan/id327765949?mt=8
Resolving itunes.apple.com... 17.250.237.16
Connecting to itunes.apple.com|17.250.237.16|:80... connected.
HTTP request sent, awaiting response... 200 Apple WebObjects
Length: 22900 (22K) [text/html]
Saving to: `id327765949?mt=8'

100%[======================================>] 22,900      --.-K/s   in 0.05s   

2010-08-03 12:38:14 (440 KB/s) - `id327765949?mt=8' saved [22900/22900]

См. старую добрую Википедию для получения дополнительной информации, но если вы хотите сканировать ее, вам может понадобиться что-то, имитирующее браузер и, таким образом,интерпретировать это - возможно watir сработает.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...