Если сайт не предоставляет API или RSS-канал, все равно возможно извлечь данные из него «по-старому» путем запроса страниц, на которых находится информация, и извлечения данных из возвращенного HTML.
В Python
это можно сделать, используя urllib2
или requests
для запросов страниц и lxml
или BeautifulSoup
для извлечения данных из HTML. Для больших проектов попробуйте использовать инфраструктуру scrapy
, которая предоставляет все для кодирования сложных пауков.