Я пытаюсь удалить некоторые данные с корейского сайта о товарах.
На веб-сайте отображаются общие данные, такие как дата прибытия, дата отдела, название материнского судна go судов.
Ссылка на веб-сайт
Черная кнопка справа - это кнопка поиска.
Для получения от нее данных , необходимо установить некоторые переключатели и нажать кнопку поиска. ответ был простой страницей без запроса на отправку.
Это запрос на отправку
POST /Berth_status_text_servlet_sw_kr HTTP/1.1
Accept: text/html, application/xhtml+xml, image/jxr, */*
Referer: http://info.bptc.co.kr:9084/content/sw/frame/berth_status_text_frame_sw_kr.jsp
Accept-Language: en-US,en;q=0.7,ko;q=0.3
User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11.0) like Gecko
Content-Type: application/x-www-form-urlencoded
Accept-Encoding: gzip, deflate
Content-Length: 40
Host: info.bptc.co.kr:9084
Pragma: no-cache
Connection: close
v_time=month&ROCD=ALL&ORDER=item2&v_gu=S
И это то, что я сделал в Python
from bs4 import BeautifulSoup
import requests
params ={'v_time': 'month',
'ROCD': 'ALL',
'ORDER': 'item2',
'v_gu': 'S'}
response = requests.post(url, data = params)
soup = BeautifulSoup(response.content,"html")
print(soup)
Я пытался поместить кодировку и другие вещи в заголовки, как показано ниже
response = requests.post(url, data = params,
headers={'Accept': 'text/html, application/xhtml+xml, image/jxr, */*',
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11.0) like Gecko',
'Content-type': 'application/x-www-form-urlencoded; text/html; charset=euc-kr',
'Accept-Language': 'en-US,en;q=0.7,ko;q=0.3'
})
Это тоже не сработало.
Коды отлично работают на других веб-сайтах, так что я думаю, что это что-то связанное с корейскими характеристиками c.
Я пытался найти решение проблемы, но мне не повезло.
Не могли бы вы мне помочь?
Спасибо!