Скачал xls с python, что привело к нарушению форматирования и ручной загрузке - PullRequest
0 голосов
/ 22 апреля 2020

Я пытаюсь загрузить Excel с этой страницы: https://webgate.ec.europa.eu/rasff-window/portal/index.cfm?event=notificationsList# и затем извлечь данные из соответствующих ячеек.

Вот код, который я использую

import requests, os

os.chdir('Path')

dls = 'https://webgate.ec.europa.eu/rasff-window/portal/index.cfm?event=ExportToExcel&StartRow=0'

resp = requests.get(dls)

with open('tester.xls', 'wb') as output:
    output.write(resp.content)

Загрузка прошла успешно, но форматирование полностью сбито (из-за XML?)

Я пытался изменить тип файла, но это не помогло.

Любая помощь с благодарностью!

1 Ответ

1 голос
/ 22 апреля 2020
import pandas as pd

df = pd.read_html(
    "https://webgate.ec.europa.eu/rasff-window/portal/index.cfm?event=notificationsList")[0]
df.drop(df.columns[-1], axis=1, inplace=True)

print(df)

df.to_csv("data.csv", index=False)

Вывод: просмотр в режиме онлайн

enter image description here

...