Locale Norway / Sweden chcp 65001 "and" chcp 1252 CSV Файл неправильно отформатирован - PullRequest
1 голос
/ 09 апреля 2020

Привет, я пытался сделать tutroial на webscraping и производить файл CSV. используя красивый суп с python, и я получаю сообщение об ошибке.

одно из предложений было go в командной строке и введите chcp 65001.

Я сделал это с моей анакондой Подсказка командной строки (Виртуальная среда), но она не устранила ошибку!

Затем я исправил первоначальную ошибку, которая включала в себя написание «закодировать UTF-8»

Код работает, но я получаю некоторые странные символы в файле CSV, который создается

Например, в столбцах даты выпуска я получаю что-то вроде «2019–02–08», когда я должен получить 2019‑02‑08.

мой код

import csv
from urllib.request import urlopen
from bs4 import BeautifulSoup

# i did this in my anaconda prompt "chcp 65001" and "chcp 1252"
# 

html = urlopen('https://en.wikipedia.org/wiki/Comparison_of_text_editors')
bsObj = BeautifulSoup(html, "lxml")
table = bsObj.findAll('table', {'class':'wikitable'})[0]
rows = table.findAll('tr')
csvFile = open('editors.csv', 'w', encoding='utf-8', newline='')
writer = csv.writer(csvFile)
try:
    for row in rows:    
        csvRow = []
        for cell in row.findAll(['td', 'th']):
            csvRow.append(cell.get_text())
        writer.writerow(csvRow)
finally:
    csvFile.close()

, чтобы попытаться исправить это, я вернулся к приглашению Anaconda и набрал "chcp 1252", но это не исправило.

Я использую spyder в анаконде окружающая обстановка. Надеюсь, я ничего не перепутал с этими командами chcp: (

Cheers

...