Мне было интересно, как Google Reader извлекает новости с веб-страницы.
Кто-нибудь из вас знает, как это работает?Или как кто-то может создать подобную систему для извлечения той же информации из HTML веб-страницы.
Очевидно, что он не использует стандарт (и при этом не читает только RSS / ATOM), потому что Google Reader доказывает, чтоон может читать содержимое страницы независимо от того, как выглядит разметка.