У меня есть созданный агрегатор новостей Newzupp , который я хочу изменить.Прямо сейчас я просто показываю заголовки новостей и связываю их с их URL.
Я планирую сделать его более графическим, используя изображения + заголовки вместо простых заголовков.Я хочу знать, как я могу получить основное изображение каждой статьи (что-то похожее на новости Google).
Один из способов, который я могу придумать, - я могу раздеть все изображения и отобразить изображение, которое указывает ната же статья.Но я не думаю, что это будет эффективно.Есть ли другой способ сделать это?
Я нашел решение для этого.
- Получить содержимое URL [html / xml]
- Очистите содержимое, используя hpricot
- Найдите все элементы с тегом "img"
- Сделайте некоторые исследования, чтобы найти, какой из них является основным отображаемым изображением.[Как 6-е изображение в случае RSS-канала Wired.com]
Я все еще думаю, что это крайне неэффективно.Мне бы хотелось узнать, как такие службы, как Новости Google, очищают сайты / блоги и отображают соответствующие изображения.