Я играл с кодом (HTML2Canvas) отсюда: https://github.com/niklasvh/html2canvas
Это инструмент Javascript на стороне клиента для преобразования HTML-страницы в элемент canvas.
Он использует прокси-сервер для извлечения HTML-кода с удаленного сайта, он делает Ajax-вызов следующим образом:
$.ajax({
data: {
xhr2:false,
url:urlParts.href
},
url: "http://html2canvas.appspot.com",
dataType: "jsonp",
success: function(html) {
Это приводит к следующему, при запросе yahoo.com в качестве примера URL, запрашиваемого URL:
http://html2canvas.appspot.com/?callback=jQuery162020564090818326575_1311846010895&xhr2=false&url=http%3A%2F%2Fwww.yahoo.com%2F&_=1311846201150
То, что я хочу сделать, это прокрутить мой собственный JSONP-прокси, на который я могу указать свою копию кода. Проблема в том, что я понятия не имею, с чего начать.
Возвращаемый JSONP (я не буду все это копировать) начинается так:
jQuery162020564090818326575_1311846010895("<!DOCTYPE html>\n<html lang=\"en-US\" class=\"y-fp-bg y-fp-pg-grad bkt701\" style=\
Таким образом, HTML экранируется и оборачивается в обратный вызов.
Я хотел бы создать скрипт Python, который будет работать точно так же и генерировать точно такой же вывод.
Может кто-нибудь указать мне правильное направление для создания прокси Python JSONP, который будет генерировать аналогичные выходные данные? Это не обязательно должен быть Python, я просто ссылаюсь на это, поскольку это то, что используется в настоящее время.