Хорошо, поэтому, просматривая сайт, я столкнулся со строкой, которая выглядит следующим образом:
'GONZÃ\x81LEZ'
Я знаю, что это должно показать 'Á'
, поэтому я попытался кодируя это, чтобы увидеть, что я получаю, и я обнаружил, что:
'Á'.encode() = b'\xc3\x81'
'Ã\x81'.encode() = b'\xc3\x83\xc2\x81'
Итак, у меня есть информация, чтобы получить моих персонажей, но там есть дополнительная информация, которой там быть не должно.
Как я могу избавиться от этих лишних байтов в моих строках, чтобы получить то, что мне нужно? То же самое происходит со всеми моими наклонными гласными, так как информация на испанском sh.