Я хочу получить xml-файл определенного источника новостей, если есть какой-либо проект, который преобразует html-новости в xml, анализирует страницу и маркирует ее различные черты, такие как дата, имя автора, заголовок, контент и т. Д. В одномXML или аналогичный тип файла.Например, смотрите эту ссылку: http://daily.bhaskar.com/article/NAT-TOP-yeddyurappa-breaks-venkaiah-naidus-laptop-slaps-minister-reports-2318460.html Как извлечь содержимое, автора, дату и т. Д. С этой веб-страницы.Или, если я могу найти канал этой веб-страницы, я могу сделать это легко.Но как я могу найти это.