lxml в Python: Скребок показывает только английские символы (другие искажены) - PullRequest
0 голосов
/ 02 февраля 2019

Вот мой код:

import requests
from lxml.etree import HTML
title_req = requests.get("https://www.youtube.com/watch?v=VK3QWm7jvZs")
title_main = HTML(title_req.content)
title = title_main.xpath("//span[@id='eow-title']/@title")[0]
print(title)
>> Halsey - Without Me - Ù\x85ترجÙ\x85Ø© عربÙ\x8a

Я хочу, чтобы это было так:

>> Halsey - Without Me - مترجمة عربي

Я пытался добавить кодировку UTF-8, но она не работает

Спасибо.

1 Ответ

0 голосов
/ 02 февраля 2019

Я не знаю почему, но эта строка создает проблему.

title_main = HTML(title_req.content)

измените ее на

title_main = HTML(title_req.text)

Я попытаюсь узнать, почему.

...