Панды read_html как сбросить индекс? - PullRequest
0 голосов
/ 20 января 2019

Я борюсь за удаление столбца индекса из фрейма данных.

Обычно, когда я читаю CSV-файл, я могу установить индекс = False или index_col = 0, и это удаляет столбец индекса. Но я не могу этого сделать при чтении html по какой-то причине. Есть идеи? Я также попробовал reset_index(drop=True). Я не хочу устанавливать ни один из столбцов для индекса.

path = 'https://en.wikipedia.org/wiki/List_of_postal_codes_of_Canada:_M' 

canada = pd.read_html(path)    

cn_table=canada[0]

1 Ответ

0 голосов
/ 20 января 2019

IIUC, вы хотите 1-й ряд в качестве заголовков, используйте header=0:

canada = pd.read_html(r'https://en.wikipedia.org/wiki/List_of_postal_codes_of_Canada:_M',header =0, flavor = 'bs4')

Или:

canada = pd.read_html(r'https://en.wikipedia.org/wiki/List_of_postal_codes_of_Canada:_M',header =0)

cn_table=canada[0]
>>cn_table

    Postcode    Borough          Neighbourhood
0   M1A         Not assigned     Not assigned
1   M2A         Not assigned     Not assigned
2   M3A         North York       Parkwoods
3   M4A         North York       Victoria Village
4   M5A         Downtown Toronto Harbourfront
5   M5A         Downtown Toronto Regent Park

... ... ... ...
288 M9Z         Not assigned     Not assigned

Чтобы сохранить фрейм данных в CSV без индекса, используйте:

cn_table.to_csv('path+filename.csv',index=False)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...