Beautifulsoup select работает в Jupyter, но не в VS Code - PullRequest
0 голосов
/ 31 марта 2020

Я создаю веб-сканер в Python с запросом и Beautifulsoup для чтения информации с веб-сайта. Сначала я создал прототип с Jupyter:

values = [x.find("div") for x in soup.find_all('td', {'data-alias': "product"})]

for i in range(0, len(values)):
    print(values[i]["data-body"])

Результат в Jupyter, как и ожидалось, "чистый" HTML контент:

<table cellpadding="2" cellspacing="0" border="0" class="w100"><tr><td class="w16"><img src="03.gif" alt="" /></td><td class="nw b">1</td><td class="nw"></td></tr><tr><td class="w16"><img src="00.gif" alt="" /></td><td class="nw b">2</td><td class="nw"></td></tr></table>

Когда я запускаю тот же код в VS Код, я получаю следующую ошибку

print(values[i]["data-body"])
TypeError: 'NoneType' object is not subscriptable

Я удалил ["data-body"] для проверки данных.

<div class="fl nw" data-body='&lt;table cellpadding="2" cellspacing="0" border="0" class="w100"&gt;&lt;tr&gt;&lt;td class="w16"&gt;&lt;img src="03.gif" alt="" /&gt;&lt;/td&gt;&lt;td class="nw b"&gt;1&lt;/td&gt;&lt;td class="nw"&gt;&lt;/td&gt;&lt;/tr&gt;&lt;tr&gt;&lt;td class="w16"&gt;&lt;img src="00.gif" alt="" /&gt;&lt;/td&gt;&lt;td class="nw b"&gt;2&lt;/td&gt;&lt;td class="nw"&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;' data-tooltip-head="Content"></div>

Тело данных выглядит как закодированный HTML содержание. Но почему этот код хорошо работает на Jupyter и приводит к ошибке в VS Code?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...