Python добавление символа «В» перед символом «µ» при попытке анализа файла XML - PullRequest
0 голосов
/ 24 января 2020

Предполагаемая кодировка файла XML - UTF-8.

Я читаю в XML файле, например:

from bs4 import BeautifulSoup
import requests

infile = open(file,"r")
xml_file = infile.read()

xml_soup = BeautifulSoup(xml_file.encode('utf-8'),'lxml-xml')

Затем я отправляю его, используя запрос на почту, например:

req = requests.Request('POST', 'url to post to',

               data=str(xml_soup).encode('utf-8'))

prepped_requ = req.prepare()
s = requests.Session()
http_response = s.send(prepped_requ)
print(http_response)

Он достигает конечная точка, но в процессе она необъяснимым образом вставляет случайные символы «Â» перед специальными символами! Есть идеи, что не так? Как именно я расправляюсь с моим файлом?

1 Ответ

0 голосов
/ 24 января 2020

Я пропустил этот бит, бит encoding="utf-8" при открытии файла!

infile = open(file,"r",encoding="utf-8")
...