Возможно, у меня достаточно продвинутый вариант использования.Я пытаюсь сохранить сайт, на котором я вошел (с помощью curl), на котором есть элементы видео HTML5, где видео получено через CORS из другого домена.Несмотря на то, что вещи кажутся сложными, FireFox Сохранить как делает потрясающую работу, когда я выбираю вариант «Полный сайт», с сохранением видео и т. Д.Но сейчас я пытаюсь сделать это через wget и не могу понять это.
Вот что содержат некоторые хитрые части страницы:
<span class="data-field source">https://dvgddacn5xxxx.cloudfront.net/53hj.mp4?response-content-disposition=inline%3Bfilename%3D%22MMM_DVD-pg3.mp4%22&Expires=2147483675&Signature=hz6jTrh5j71D2x4QTSSB6myPAB5a69pDTNV5CgdB0DVu7~E1bluCenDMFoEnX2KX~tt0nHECurIalXsu8icE6rZQo5C9AoYihTVPD49pBJcBJA3yQffu-wo1AODWqgFu6uwzfS2FtBZhhwMmDrjJiHxLCKSTObkIYLZ7PZ7QN08_&Key-Pair-Id=APKAIVZN4AJ799UIENTQ</span><span class="data-field poster">https://dvgddacn5gxxx.cloudfront.net/49ji.jpg?response-content-disposition=inline%3Bfilename%3D%22L1-MMG_DVD-pg3.jpg%22&Expires=21474836547&Signature=VcQ2sde9X8-EAPLGqp9I28LOf67ueNciGnVXkuh19NJG8MUzNy-N8e~ElbFS87JZIiG3nLIIqhqIzD6YJ6WbqwbQVaOT0wxYuISEslxJhkHlEjh-~jkpvTCv2BKOtvxEwTjh-ipbJjs-FI~qBKrEjlDHWOL0H7IW0x5jYaxhQeE_&Key-Pair-Id=APKAIVZN7KJ762UIENTQ</span>
Это перед любыми манипуляциями с jQuery / Ajax.Кстати, вот как выглядит приведенное выше, когда я выбираю «Сохранить как» в Firefox (то есть после jQuery):
<img id="jp_poster_1" src="https://dvgddacn5gxxx.cloudfront.net/49ji.jpg?response-content-disposition=inline%3Bfilename%3D%22L1-MMG_DVD-pg3.jpg%22&Expires=21474836547&Signature=VcQ2sde9X8-EAPLGqp9I28LOf67ueNciGnVXkuh19NJG8MUzNy-N8e~ElbFS87JZIiG3nLIIqhqIzD6YJ6WbqwbQVaOT0wxYuISEslxJhkHlEjh-~jkpvTCv2BKOtvxEwTjh-ipbJjs-FI~qBKrEjlDHWOL0H7IW0x5jYaxhQeE_&Key-Pair-Id=APKAIVZN7KJ762UIENTQ" style="width: 640px; height: 480px; display: inline;"><video id="jp_video_1" preload="none" crossorigin="use-credentials" style="width: 0px; height: 0px;"><source src="https://dvgddacn5xxxx.cloudfront.net/53hj.mp4?response-content-disposition=inline%3Bfilename%3D%22MMM_DVD-pg3.mp4%22&Expires=2147483675&Signature=hz6jTrh5j71D2x4QTSSB6myPAB5a69pDTNV5CgdB0DVu7~E1bluCenDMFoEnX2KX~tt0nHECurIalXsu8icE6rZQo5C9AoYihTVPD49pBJcBJA3yQffu-wo1AODWqgFu6uwzfS2FtBZhhwMmDrjJiHxLCKSTObkIYLZ7PZ7QN08_&Key-Pair-Id=APKAIVZN4AJ799UIENTQ" type="video/mp4">
Таким образом, все немного меняется (в том числе для видео добавление тега crossorigin)= "use-credentials"), но исходные пути все еще там.
Я не знаю, видит ли wget манипуляцию до или после jQuery, но в любом случае, вот что яя пытаюсь, основываясь на некоторых исследованиях :
wget --load-cookies /tmp/cookies/cookie1.txt -r -np -nd -l 1 -nc -H -nH -E -p -k -P savedstuff http://someurl
Я заметил, что wget с трудом сохраняет файлы изображений, так как имена файлов заканчиваются слишком долго.Поэтому, когда он видит что-то вроде этого
..... 49ji.jpg? Response-content-disposition = inline% 3Bfilename% 3D% 22L1-MMG_DVD ... и т. Д. И т. Д.
он пытаетсясохранение со всеми ненужными файлами после имени файла, тогда как FireFox сохраняет только имя файла.
Кроме того, похоже, что он вообще не касается видеофайлов.
Плюс он пытаетсяЗагрузите файл robots.txt с внешних доменов и создайте HTML-файлы на основе ссылок, отображаемых на интересующей странице. FireFox не сохраняет ничего из этого - он просто сохраняет именно то, что мне нужно : HTML-файл, все CSS и JS, а также все мультимедиа.
Итак ... большой вопрос: кто-нибудь знает, как я могу заставить wget работать как FireFox Сохранить сайт завершен ?
Спасибо!
Брайан