Пока я проверял RSS-канал, в браузере я вижу следующий текст:
3 装 配上 超短 迷你裙 迷你裙 暴露 暴露 不得 不得 专 专 大专打扮 的 随 性 打扮 ...
Но то же представление исходного кода преобразуется в десятичное, как показано ниже:
#30701裤、迷你裙、吊带装、人字拖鞋......大
987学生的穿着打扮及潮流品味,一直都是是大家讨论的
8909门话题。&
Это связано с локализацией содержимого или файласохраняется в другой кодировке?Я вижу, что файл сохранен с использованием UTF-8.
Я пытаюсь проанализировать RSS-канал с помощью Python.Но после разбора я получаю только десятичные значения, а не фактические символы.