Я пытаюсь извлечь из него страницу для анализа информации с помощью cfhttp. Заголовки страниц, которые я вызываю:
Кодировка содержимого: gzip
Соединение: Keep-Alive
Длина содержимого: 19066
Сервер: IBM_HTTP_Server
Варьируется: Accept-Encoding, User-Agent
Content-Language: en-US
Cache-Control: no-cache = "set-cookie,
установленный Cookie2"
Content-Type:
* * Текст тысячу двадцать-один / HTML, кодировка = ISO-8859-1 * * 1 022
Я установил кодировку на ISO-8859-1, однако в FileContent получаю следующее (ниже показан только небольшой пример, но я думаю, что он указывает).
EðÑq · oÀ? · М \ ZóL¯þ'Vú5ðbä £ ÿæ¾_HÉÒñQãO \ Çþãë85ÁÜ
а ± ° UO} & bßý?, U? 2SùQyk5g? UÛ3Ѹfã × ARÃi_iûRã
_ òCA¿-ß. "b /¯ßíWÝÆ´}w~,°iøÜCáÇþ@ÃZ5¤ïsÁ8½°ì*
ZÜéjOÝK/Ë4§ÈG5×ä*¬6ÚwÇ0]ã:àÑþé¬G"ÅÁl/t°
jlá»5¶&¯lìYìºØ'yDð½|#ý<ñìTé%¾ï¬ùƪx¶}«±o9»ë¼ÂÆÒï'w8Y?
÷ ðxsllû
6íqüGÞsÜóÀx · ªk®XºàåZ {íÁ½åo ÷ МБк ¥ ÝÃ8M
Я пробовал другие кодировки и рассматривал кодировку gzip как вызывающую проблему, но я не уверен, как проверить, является ли это проблемой. Любые предложения или помощь будут высоко оценены.
Ниже мой код
<cfhttp
METHOD="get"
throwonerror="yes"
CHARSET="ISO-8859-1"
URL="http://www.cars.com/for-sale/searchresults.action?sf1Dir=DESC&prMn=1&crSrtFlds=stkTypId-feedSegId-pseudoPrice&rd=100000&zc=44203&PMmt=0-0-0&stkTypId=28881&sf2Dir=ASC&sf1Nm=price&sf2Nm=miles&feedSegId=28705&searchSource=UTILITY&pgId=2102&rpp=10">
<cfhttpparam type="Header" name="Accept-Encoding" value="deflate;q=0">
<cfhttpparam type= "Header" name= "TE" value= "deflate;q=0" >
</cfhttp>
<cfset listings = #cfhttp.FileContent#>
<cfoutput>
#listings#
</cfoutput>
Я также попробовал заголовки:
<cfhttpparam type="Header" name="Accept-Encoding" value="*">
<cfhttpparam type= "Header" name= "TE" value= "deflate;q=0" >
И попытался удалить заголовок «Accept-Encoding» и просто оставить TE.
UPDATE:
Я до сих пор не понял этого, но нашел кое-что, что могло бы помочь кому-то помочь мне. Когда я использовал мой тестовый php-сервер для запуска file_get_contents на той же странице, и он работал нормально, тогда, если я запустил тот же код cfhttp для вызова страницы php, которая вызывала нужную мне страницу, она работала просто отлично. Спасибо за предложения.