как я могу кодировать свои данные, используя запросы библиотеки - PullRequest
0 голосов
/ 26 марта 2019

im scrappy некоторые данные с веб-сайта, но данные в юникоде, и я хочу преобразовать в utf-8

    url = 'https://www.cartolafcbrasil.com.br/scouts/cartola-fc- 
    2018/rodada-1'
    page = requests.get(url)
    soup = BeautifulSoup(page.text, 'html.parser')
    variaveis = []
    table = soup.find_all('table')[0]
    df = pd.read_html(str(table))
    print(df)

[0 1 2 3 4 5 \ 0 Nome Clube Preço JMà © dia Ãlt.Pont.
1 Serginho (MEI) NaN 1578 1 1790 1790
2 Otero (MEI) NaN 1481 1 1650 1650
3 Rodriguinho (MEI) NaN 2308 1 1650 1650
4 Ричард (MEI) NaN1461 1 1620 1620
5 Carlinhos (LAT) NaN 1440 1 1590 1590
6 Густаво Бланко (MEI) NaN 1268 1 1540 1540
7 Джори (GOL) NaN 1013 1 1370 1370
8 Тиаго Карлето(LAT) NaN 1254 1 1320 1320
9 Vector Cuesta (ZAG) NaN 1385 1 1310 1310
10 Яго Пикачу (LAT) NaN 1433 1 1280 1280
11 Вагнер (MEI) NaN 1350 1 1260 1260
12 Лукас Пакете (MEI) NaN 1798 1 1210 1210

1 Ответ

0 голосов
/ 26 марта 2019

Просто передайте параметр кодирования пандам read_html :

df = pd.read_html(str(table), encoding="UTF-8")
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...