Это немного похоже на yql , которое можно использовать для чего-то подобного.Учитывая, что HTML может быть XML, а RSS-каналы также являются XML, это не должно быть слишком сложным для реализации.Если бы я подошел к пользовательской реализации этого, я бы, вероятно, попытался бы сделать следующее:
- Получить html из запрошенного URL
- Очистить HTML, чтобы он мог быть преобразован в XML(или используйте что-то вроде HTML Agility Pack )
- Используйте XSLT для перевода XML-документа в RSS-канал на основе набора правил (которые извлекают ссылки и т. д.)
С учетом всего вышесказанного, если бы я мог вместо этого использовать что-то вроде yql, я бы определенно сделал это, поскольку в пользовательской реализации может быть много подводных камней (плохой HTML, изменение URL-адресов, определение правил,кеширование и пр.)