Я использую красивый суп, чтобы очистить некоторые данные:
url = "https://www.transfermarkt.co.uk/jorge-molina/profil/spieler/94447"
heads = {'User-Agent' : 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36'}
response = requests.get(url,headers=heads)
soup = BeautifulSoup(response.text, "lxml")
Затем я извлекаю определенную часть информации:
height = soup.find_all("th", string=re.compile("Height:"))[0].findNext("td").text
print(height)
, которая работает как задумано, печатая
1,74 m
но когда я пытаюсь оценить эту строку с помощью этой функции:
def format_height(height_string):
return int(height_string.split(" ")[0].replace(',',''))
я получаю следующую ошибку:
format_height(height)
Traceback (most recent call last):
File "get_player_info.py", line 73, in <module>
player_info = get_player_info(url)
File "get_player_info.py", line 39, in get_player_info
format_height(height)
File "/Users/kompella/Documents/la-segunda/util.py", line 49, in format_height
return int(height_string.split(" ")[0].replace(',',''))
ValueError: invalid literal for int() with base 10: '174\xa0m'
Мне интересно, как я долженоцените шестнадцатеричные значения, которые я получаю?