Если я добавлю URL фида в Google Reader или в агрегатор фидов на рабочем столе, я получу хорошие результаты. URL-адрес:
http://estaticos03.marca.com/rss/futbol_1adivision.xml
Но когда я получаю один и тот же URL-адрес из сценария (сценарий python, используя библиотеку feedparser), я получаю немного другое содержимое для тех же результатов (например, заголовок для каждой записи различен и все в верхнем регистре).
Я полагаю, что на стороне сервера что-то делается, чтобы попытаться отговорить таких людей, как я, анализировать контент для моих собственных проектов (фид из популярной футбольной газеты), но я не уверен в этом. Я пытался передать некоторые пользовательские агенты (например, Google Reader), но все равно не повезло, так что, может быть, они также проверяют IP? Я действительно в замешательстве.
Есть идеи, почему это происходит со мной?
Спасибо!