Лучший способ обслуживания сторонних HTML на вашем сайте? - PullRequest
0 голосов
/ 21 января 2012

Я создаю веб-приложение, в котором пользователи могут создавать собственные веб-страницы, которые извлекают контент из других веб-страниц. Я знаю несколько вариантов для этого, и я не уверен, что лучше, и есть ли лучшие решения там. Прямо сейчас я мог бы:

  • Используйте iframes, которые (вроде бы) будут выполнять то, что я хочу, но заставят клиента загружать и отображать весь веб-контент, который кажется медленным. Я слышал, многие люди говорят, что iframes устарели и не должны использоваться, и т. Д.
  • Используйте библиотеку наподобие wkhtmltopdf, которая будет рендерить html на стороне сервера и генерировать ее PDF-изображение. Это бы хорошо работало, но в результате получилось просто изображение, поэтому текст не мог бы быть выделен, ссылки не будут кликабельными и т. Д. Кроме того, я слышал, что у вас могут возникнуть юридические проблемы при размещении чужого веб-контента на Ваш сайт без разрешения.
  • Используйте что-то вроде phpquery для буквального удаления контента с других сайтов. Эта опция может иметь те же юридические проблемы, что и вышеуказанная опция.

Кто-нибудь делал что-нибудь подобное или у кого-нибудь есть мысли?

Ответы [ 2 ]

1 голос
/ 21 января 2012

Самым чистым решением будет отправка с http-стороны сервера запросов, а затем рендеринг html на вашу страницу по мере необходимости, для этого также потребуется изменить все URL-адреса контента и ссылок на абсолютные

, например:

<img src="\images\banner.png"> 

будет работать на удаленном сервере, но, попав внутрь вашей страницы, изображение не будет существовать.Наиболее работоспособным решением было бы ограничить функциональность изображениями и ссылками, а затем выполнить поиск / замену с помощью регулярного выражения для сопоставления относительных URL-адресов и добавить к нему исходный адрес.

Однако вы столкнетесь с юридическими проблемами, еслиповторная отправка контента других людей с вашего сервера, даже просто html.

Использование iframe было бы быстрым грязным решением и, вероятно, имело бы наименьшие юридические последствия, поскольку браузер отправлял на сайт обычный запрос контента.

0 голосов
/ 28 января 2012

Я бы порекомендовал DocRaptor для создания PDF-файлов из HTML. Он работает аналогично wkhtmltopdf, но создает полнофункциональные файлы PDF.

Вот ссылка на его домашнюю страницу:

http://docraptor.com/

И ссылка на документацию по API:

http://docraptor.com/documentation

...