Python Pandas read_html завершается ошибкой при чтении таблиц из Википедии - PullRequest
0 голосов
/ 11 июня 2018

Я пытаюсь прочитать таблицы со страницы Википедии, используя следующий код:

import pandas as pd
pd.read_html('https://en.wikipedia.org/wiki/2013–14_Premier_League')

В результате возникает следующая ошибка:

UnicodeEncodeError: 'ascii' codec can't encode character '\u2013' in    position 14: ordinal not in range(128)

Я пытался

pd.read_html('https://en.wikipedia.org/wiki/2013–14_Premier_League', encoding='utf-8')

Но все равно получаю ту же ошибку.Следующие работы:

import requests
r = requests.get('https://en.wikipedia.org/wiki/2017–18_Premier_League')
c = r.content
dfs = pd.read_html(c)

Я хочу знать, как заставить pd.read_html() работать непосредственно с URL без requests.Что я не понимаю в кодировке или это проблема с Pandas?

Я использую Anaconda для Pandas 0.21.1 и Python 3.5.4.Спасибо за любую помощь.

1 Ответ

0 голосов
/ 11 июня 2018

Проблема с

https

Попробуйте удалить S в https, и вы можете обратиться к документации здесь

...