Как найти RSS-канал определенного сайта? - PullRequest
52 голосов
/ 13 июня 2011

Как найти RSS-канал определенного сайта?Есть ли какой-то конкретный способ найти его?

Ответы [ 5 ]

68 голосов
/ 13 июня 2011

Вы можете найти его, посмотрев на источник домашней страницы (или блога).Найдите строку, которая выглядит следующим образом:

<link rel="alternate" type="application/rss+xml" title="RSS Feed" href="http://example.org/rss" />

Значение href будет там, где находится RSS.

13 голосов
/ 13 ноября 2014

Есть несколько способов получить RSS-канал сайта.

Что вы можете сделать, это получить исходный код веб-сайта и выполнить поиск по этому тегу ссылки type="application/rss+xml"

Это будет содержать RSS-канал этого сайта, если таковой имеется.

Вот простая программа на python, которая будет печатать RSS-канал любого веб-сайта, если таковой имеется.

import requests  
from bs4 import BeautifulSoup  

def get_rss_feed(website_url):
    if website_url is None:
        print("URL should not be null")
    else:
        source_code = requests.get(website_url)
        plain_text = source_code.text
        soup = BeautifulSoup(plain_text)
        for link in soup.find_all("link", {"type" : "application/rss+xml"}):
            href = link.get('href')
            print("RSS feed for " + website_url + "is -->" + str(href))

get_rss_feed("http://www.extremetech.com/")

Сохраните этот файл с расширением .py и запустите его. Он даст вам RSS-канал для этого сайта.

Google также предоставляет API для поиска RSS-каналов веб-сайта. Пожалуйста, найдите их здесь: Google Feed API

0 голосов
/ 15 апреля 2018

В меню инструментов Firefox теперь есть команда «Информация о странице». На одной из вкладок этого инструмента отображается информация об обнаруженной ленте.

0 голосов
/ 06 августа 2017

Вам нужно перебрать все URL-адреса на вашем веб-сайте, а затем найти тот, который содержит «rss».

Приведенный выше метод может не работать в некоторых случаях, если URL-адрес в теге href выглядит примерно так: feed.xml , поэтому в этом случае вам нужно будет перебрать все теги, содержащие href AND rss , затемпросто проанализируйте URL из атрибута href .

Если вы хотите сделать это через браузер, нажмите CTRL + U, чтобы просмотреть источник, затем CTRL + F, чтобы открыть окно поиска, а затем просто введите * Новости * 1018. URL-адрес RSS-ленты должен появиться немедленно.

0 голосов
/ 27 января 2015

Мне нужно было найти сайты с RSS-лентами.Используя Visual Studio (VB) я смог это сделать.Следующий код просто фрагмент.Он умирает после завершения цикла, но находит ссылку на страницу rss на сайте.Это все, что мне было нужно, поэтому я так и не закончил.Но у меня это сработало.

Импортирует System.Net Импортирует System.IO

... Dim request As WebRequest request = WebRequest.Create ("http://www.[site]")

    Dim response As WebResponse = request.GetResponse()
    Dim responseStream As Stream = response.GetResponseStream()
    Dim reader As New StreamReader(responseStream)

    Dim line As String = reader.ReadLine()
    Dim intPos As Integer

    Do
        line = reader.ReadLine()
        intPos = line.IndexOf("/rss")
        If intPos > 0 Then
            MessageBox.Show(line + " " + intPos.ToString)
        End If
    Loop While Not line Is Nothing

....

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...