Что ж, для того, чтобы делать то, что вы хотите, вам, в основном, нужно написать функции, которые извлекают то, что должно быть визуализировано (для рендеринга, оно должно быть извлечено, конечно) из ответа сервера вам (в случае веб-сайтов, все html
содержимое + заголовки ответа).
Например, вам нужно извлечь все ссылки на изображения из html, используя регулярное выражение, как показано ниже:
/(alt|title|src)=("[^"]*")/gi;
(Ссылка . SO )
Вам также необходимо извлечь js файлов, которые должны быть загружены для правильной работы файла html.
Вы можете использовать различные инструменты для извлечения файлов такого типа.
Кто-нибудь может подтвердить, можно ли это сделать в Python?
Да
Edit
Я думаю, лучше упомянуть, что вы должны также уделить особое внимание Заголовкам. Печенье, безусловно, самые важные.