Привет, я пытался сделать tutroial на webscraping и производить файл CSV. используя красивый суп с python, и я получаю сообщение об ошибке.
одно из предложений было go в командной строке и введите chcp 65001.
Я сделал это с моей анакондой Подсказка командной строки (Виртуальная среда), но она не устранила ошибку!
Затем я исправил первоначальную ошибку, которая включала в себя написание «закодировать UTF-8»
Код работает, но я получаю некоторые странные символы в файле CSV, который создается
Например, в столбцах даты выпуска я получаю что-то вроде «2019–02–08», когда я должен получить 2019‑02‑08.
мой код
import csv
from urllib.request import urlopen
from bs4 import BeautifulSoup
# i did this in my anaconda prompt "chcp 65001" and "chcp 1252"
#
html = urlopen('https://en.wikipedia.org/wiki/Comparison_of_text_editors')
bsObj = BeautifulSoup(html, "lxml")
table = bsObj.findAll('table', {'class':'wikitable'})[0]
rows = table.findAll('tr')
csvFile = open('editors.csv', 'w', encoding='utf-8', newline='')
writer = csv.writer(csvFile)
try:
for row in rows:
csvRow = []
for cell in row.findAll(['td', 'th']):
csvRow.append(cell.get_text())
writer.writerow(csvRow)
finally:
csvFile.close()
, чтобы попытаться исправить это, я вернулся к приглашению Anaconda и набрал "chcp 1252", но это не исправило.
Я использую spyder в анаконде окружающая обстановка. Надеюсь, я ничего не перепутал с этими командами chcp: (
Cheers