У меня установлен wget вместе с плагином Firefox, чтобы получить код wget для загрузки страницы. Я также добавил некоторые опции, но wget загружает только исходную страницу, и когда я смотрю на исходную страницу, она имеет следующие странные символы:
* 1002 •
Y ~ qWŸÎÎ1-»~~ SšäI DVU † Òô'Ì '' ×} -Z & ó? (_ÄçéüZ: Q³ & ¢ ½: ‰
© nÁjF¬ÛUÂ-B8 ¥>)? KÞSz ¥ ¬0PnÊuM¹μþ ™ âCÂUJmoH ® · kČȚmýú² · YTQ? Io
»OÀ'd2 ‰ Î-ESS + Íoÿmμ ^ Uha
Ã8ò˜‘¬"
å7TÞÃhoøÓ {п-yºBa = ŸIAÂÚc8ú Œ-üKþåÆgÑOn¼-ÌóRXißCÄ ~ Ii-ŒäLÝdÒ:! МВТ * gtÑr'μB«÷ ÚÓÒÕñCÜ + @ oÀyE> FæçF»И1 'ƒG # Ïr
#
aXEYSÑæ—¿Gê
®"¾nC£9²–zkXSvR <F¤°ãÑ´¾µ}²¼å¸j×Î÷™¶ð;¤Ö²Ýxp®[ãú6€ÇÞ‰àÒzðh¼ýcð>ôvXxÛx4üŠåVíûØÛà²Oíh̲ëÑ„AêV…é-Rm!Ѽq
Üү߽úâ’<Þ¸á1zã¤kûgª€¥Áw˜â#~txØ«® Ü[øFu Á½Xš-SòÛ“üüOt--UÅ”Ðí´À‡‹ÇÃß÷²Uúá× J;vèÞeg‚•Ø#0ÇO%ŠÏ
T?Ê_ ü'Yƾ<¢?'b³èA
¸‡€Î\HΞO®äÖǼŽ¸½ï²‹+u¥·»ž ·Ž9Ñ·öÚ[‚PÇ µœûg
| RošOp9þìQ, Ĉ¼JÞáí²z $ q ¢ NÐ… kƒ »Ö; HÌV 8? ¼} ¼ñQiöÅPq> þN7dÑâ # # ¯âi ° ~ BÛt + 7 æ õ • G ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ù ~ «¼37²˜¼¬ † ÌÁ¹½ / ¡ú ° f £]) ‡ [ÖUª“ ÿ ½ÿ {ä
Я уже сталкивался с этой проблемой и с одним другим сайтом. Вот команда, которую я использую.
wget -e robots = off -m --wait 1 -H -l1 --tries = inf --retry-connrefused -r --convert-links --append-output = C: \ legalassetlog.txt - header = "Host: sitename" --header = "User-Agent: Mozilla / 5.0 (Windows NT 6.0; rv: 11.0) Gecko / 20100101 Firefox / 11.0" --header = "Принять: текст / html, приложение / xhtml + xml, application / xml; q = 0,9, / ; q = 0,8 "--header =" Accept-Language: en-us, en; q = 0,5 "--header =" Accept-Encoding: gzip, deflate "--header =" DNT: 1 "--header =" Соединение: keep-alive "--header =" Ссылка: сайт "" сайт "--content-disposition
На исходной странице есть много других основных HTML-ссылок, но wget не будет загружать ни одну из них.
Что я могу сделать, чтобы решить эту проблему?