Я использую lxml для анализа html-файлов с заданными URL-адресами.
Например:
link = 'https://abc.com/def'
htmltree = lxml.html.parse(link)
Мой код работает хорошо в большинстве случаев, с кодом http://
.Однако я обнаружил, что для каждого https://
URL-адреса lxml просто получает IOError .Кто-нибудь знает причину?И возможно, как исправить эту проблему?
Кстати, я хочу придерживаться lxml, а не переключаться на BeautifulSoup, учитывая, что у меня уже есть готовая программа.