Есть несколько способов получить RSS-канал сайта.
Что вы можете сделать, это получить исходный код веб-сайта и выполнить поиск по этому тегу ссылки type="application/rss+xml"
Это будет содержать RSS-канал этого сайта, если таковой имеется.
Вот простая программа на python, которая будет печатать RSS-канал любого веб-сайта, если таковой имеется.
import requests
from bs4 import BeautifulSoup
def get_rss_feed(website_url):
if website_url is None:
print("URL should not be null")
else:
source_code = requests.get(website_url)
plain_text = source_code.text
soup = BeautifulSoup(plain_text)
for link in soup.find_all("link", {"type" : "application/rss+xml"}):
href = link.get('href')
print("RSS feed for " + website_url + "is -->" + str(href))
get_rss_feed("http://www.extremetech.com/")
Сохраните этот файл с расширением .py и запустите его. Он даст вам RSS-канал для этого сайта.
Google также предоставляет API для поиска RSS-каналов веб-сайта.
Пожалуйста, найдите их здесь: Google Feed API