Вот URL сайта, который я хочу получить
https://salami.parc.com/spartag/GetRepository?friend=jmankoff&keywords=antibiotic&option=jmankoff%27s+tags
Когда я выбираю веб-сайт со следующим кодом и отображаю содержимое со следующим кодом:
sock = urllib.urlopen("https://salami.parc.com/spartag/GetRepository?friend=jmankoff&keywords=antibiotic&option=jmankoff's+tags")
html = sock.read()
sock.close()
soup = BeautifulSoup(html)
print soup.prettify()
Я получаю следующий вывод:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<html>
<head>
<title>
Error message
</title>
</head>
<body>
<h2>
Invalid input data
</h2>
</body>
</html>
Я получаю такой же результат и с urllib2. Интересно, что этот URL работает только на веб-браузере Shiretoko v3.5.7. (когда я говорю, что это работает, я имею в виду, что это приносит мне правильную страницу). Когда я передаю этот URL в Firefox 3.0.15 или Konqueror v4.2.2. Я получаю точно такую же страницу ошибки (с «Неверные входные данные»). Я понятия не имею, что создает эту разницу и как я могу получить эту страницу, используя Python. Есть идеи?
Спасибо