Я пытаюсь извлечь определенный столбец из таблицы HTML, используя панд - PullRequest
0 голосов
/ 07 октября 2019
import quandl
import pandas as pd
fiddy_states = pd.read_html('https://www.infoplease.com/us/postal-information/state-abbreviations-and-state-postal-codes')
print(fiddy_states[0][0])

Я получаю ошибку, которую не могу понять. Так как я новичок в этом, я не могу найти решение. Я просто хочу столбец почтового индекса из таблицы в URL.

Ответы [ 2 ]

0 голосов
/ 07 октября 2019

Ссылка, которую вы предоставили, имеет две таблицы - следовательно, два соответствующих кадра данных.

Вы можете получить их по:

import quandl
import pandas as pd
fiddy_states = pd.read_html('https://www.infoplease.com/us/postal-information/state-abbreviations-and-state-postal-codes')
# First Table
fiddy_states[0]['Postal Code']
# Second Table
fiddy_states[1]['Postal Code']
0 голосов
/ 07 октября 2019

Попробуйте любой из инструментов утилизации, например, красивый суп или селен. и сам вопрос неясен! скажите мне, почему вы используете панды для HTML-страницы. если вы хотите извлечь колонку с веб-страницы здесь - это решение уже доступно.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...