Я абсолютный новичок в программировании на Python, и это тоже Web Scraping.Я пытался почистить веб-сайт для практических целей.
Я использовал модуль BeautifulSoup и Requests.
Код приведен ниже:
import requests
import xlwt
from bs4 import BeautifulSoup
from csv import writer
response=requests.get("https://www.wikipedia.org/")
wb=xlwt.Workbook()
ws=wb.add_sheet("Test")
soup=BeautifulSoup(response.content,"html.parser")
links=soup.find_all("strong")
for link in links:
lang=link.get_text()
for i in len(lang):
ws.write(i,i,lang)
wb.save("Wiki.xls")
Я очистилзаголовки с веб-страницы, но во время записи в файл Excel отображается следующая ошибка:
File "C:/Users/laptop/PycharmProjects/myproject/srapingex1.py", line 16, in <module>
for i in len(str(lang)):
TypeError: 'int' object is not iterable
Основная проблема заключается в том, что синтаксис ws.write(row,column,data)
требует адреса строки, адреса столбцаи данные.
Поскольку я не знаю предопределенного размера списка, то как можно передать строку, адрес столбца.
Пожалуйста, скажите, если я делаю код неправильно, и любезно предложите, если есть какой-либо способ записать извлеченные элементы в файл .xls.