element.text_content () библиотеки lxml дал мне юникод, поэтому я закодировал юникод в utf-8, и это кажется странным - PullRequest
0 голосов
/ 23 мая 2019

lxml element.text_content() странно дал мне текст в юникоде. Поэтому я закодировал его в utf-8 и проверил результат. Хотя, когда я печатаю «все выглядит как человеческий язык». Когда я просто набрал имя списка и посмотрел на str, это выглядит так, как показано ниже. Если он успешно закодирован, почему некоторые выглядят как человеческий язык, а другие - как закодированный язык?

[
  'The ABC of Bar\xc3\x83\xc2\xa7a v Valencia',
  'Ter Stegen ruled out for Copa del Rey final',
  'Lenglet back in the final - this time for Bar\xc3\x83\xc2\xa7a!',
  'When and where to follow the Copa del Rey final',
  'Bar\xc3\x83\xc2\xa7a will play two friendlies in Japan',
  'Leo Messi, chosen as best player in La Liga for March',
  'The other side of Eibar - Bar\xc3\x83\xc2\xa7a',
  'Training (20-05-19)',
  'The final game of the league season in photos',
  'Trip to Eibar'
]
...