Я работал над очисткой веб-страниц и продвинулся довольно далеко в подготовке своей таблицы к веб-странице, с которой выполняю очистку.
Проблема в том, что я не могу получить записи, которые содержат толькоданные (строки, начинающиеся с '
').Мой код выглядит следующим образом:
url = requests.get('https://en.wikipedia.org/wiki/Demographics_of_Toronto_neighbourhoods')
soup = BeautifulSoup(url.text,'lxml')
print(soup.prettify())
table_classes = {'class':'sortable'}
raw_table = soup.findAll("table", table_classes)
print(raw_table)
Помещение строки кода в гнездо вызывает ошибку 'У объекта ResultSet нет атрибута' find_all '.Вы, вероятно, рассматриваете список предметов как отдельный предмет.Вы вызывали find_all (), когда намеревались вызвать find () ':
td_tags = raw_table.find_all('<td>')
td_tags
Глядя на тип данных, я пытался использовать find (), и он все ещевызвал ту же ошибку, поэтому я попытался зациклить каждую строку со следующим кодом:
for line in raw_table:
if line.get_text().find('<td>') > -1:
line
Когда я запускаю этот цикл, ничего не происходит.если я помещаю его вне цикла 'if', то он просто возвращает каждую строку в таблице 'Canada_table_raw'
Как я могу получить записи с тегом '', чтобы я мог затем поместить результаты вкадр данных панд?