Wget заменит скачанный ключ, если существует && a.html - PullRequest
0 голосов
/ 08 февраля 2019

Настройка простого статического http-сервера с 3 файлами.Предположим, что host является http://127.0.0.1:8082.

  • a && a.html, с тем же содержимым, которое содержит ссылку на b
<body>
    <a href="b"></a>
</body>
  • b,который содержит 2 ссылки на одноименный URL-адрес, но разные суффиксы.
<body>
    <a href="a"></a>
    <a href="a.html"></a>
</body>

Я пытаюсь использовать wget -E -m -p -k http://127.0.0.1:8082/a и ожидаю, что обе ссылки в b будут преобразованы в относительные пути.Но на самом деле результат таков:

<body>
    <a href="http://127.0.0.1:8082/a"></a>
    <a href="a.html"></a>
</body>

Полагаю, что wget обрабатывает && a.html как тот же файл (как -E).При преобразовании ссылок в b существующий a был ошибочно принят как не загруженный, поскольку a.html перезаписал загруженный ключ.


[zhong@localhost wget]$ wget -E -m -p -k http://127.0.0.1:8082/a
- 2019-02-09 20:58:42 -- http://127.0.0.1:8082/a
Connecting 127.0.0.1:8082... Connected.
HTTP request has been issued, waiting for response... 200 OK
Length: 35 [text/html]
Save to "127.0.0.1:8082/a.html"

127.0.0.1:8082/a.html 100%[=========================>] 35 - - KB/s takes 0s

2019-02-09 20:58:42 (4.17 MB/s) - Preserved "127.0.0.1:8082/a.html" [35/35])

Robots.txt is being loaded; please ignore the error message.
- 2019-02-09 20:58:42 -- http://127.0.0.1:8082/robots.txt
Reuse existing connections to 127.0.0.1:8082.
An HTTP request has been issued and is awaiting a response... 404 Not Found

2019-02-09 20:58:42 Error 404: Not Found.
Conversion from UTF-8 to UTF-8 is not supported
- 2019-02-09 20:58:42 -- http://127.0.0.1:8082/b
Reuse existing connections to 127.0.0.1:8082.
HTTP request has been issued, waiting for response... 200 OK
Length: 61 [text/html]
Save to "127.0.0.1:8082/b.html"

127.0.0.1:8082/b.html 100%[=========================>] 61 - - KB/s takes 0s

2019-02-09 20:58:42 (7.27 MB/s) - Preserved "127.0.0.1:8082/b.html" [61/61])
Conversion from UTF-8 to UTF-8 is not supported

- 2019-02-09 20:58:42 -- http://127.0.0.1:8082/a.html
Reuse existing connections to 127.0.0.1:8082.
HTTP request has been issued, waiting for response... 200 OK
Length: 35 [text/html]
Save to "127.0.0.1:8082/a.html"

127.0.0.1:8082/a.html 100%[=========================>] 35 - - KB/s takes 0s

2019-02-09 20:58:42 (2.78 MB/s) - Preserved "127.0.0.1:8082/a.html" [35/35])

Download completed -- 2019-02-09 20:58:42--
Total time: 0.009s
Downloaded: 3 files, 131 in 0s (4.46 MB/s)
Links in 127.0.0.1:8082/a.html are being converted... 1-0
Links in 127.0.0.1:8082/b.html are being converted... 1-1
Links in two files have been converted in 0.001 seconds
...