Импортировать таблицу с сайта с BeautifulSoup - PullRequest
0 голосов
/ 26 мая 2019

Я пытаюсь импортировать таблицу с веб-сайта, а затем преобразовать данные в кадр данных pandas.

Сайт: https://en.wikipedia.org/wiki/List_of_postal_codes_of_Canada:_M

Вот мой код:

import numpy as np 
import pandas as pd 
import requests
from bs4 import BeautifulSoup

website_url = requests.get(
'https://en.wikipedia.org/wiki/List_of_postal_codes_of_Canada:_M').text 

soup = BeautifulSoup(website_url,'lxml')

My_table = soup.find('table',{'class':'wikitable sortable'})

for x in soup.find_all('table',{'class':'wikitable sortable'}):
    table = x.text


print(My_table)
print(table)

Вывод на печать (My_table)

Вывод на печать (таблица)

Как мне преобразовать эту таблицу веб-страниц в фрейм данных panda? panda dataframe

1 Ответ

0 голосов
/ 26 мая 2019

Вы пробовали

pd.read_html()

?

Кроме того, поскольку таблица очень стандартная, почему бы не скопировать таблицу непосредственно в excel и не импортировать ее как DataFrame?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...