Экспорт таблицы HTML в Excel без ссылки на страницу sh с использованием python - PullRequest
0 голосов
/ 24 февраля 2020

У меня есть веб-страница, на которой пользователь может создать таблицу с без строк и без столбцов input.

Теперь я хочу экспортируйте эту HTML таблицу в файл Excel, используя python. После некоторого поиска в Google я узнал о фрагменте to_excel , как показано ниже.

import pandas as pd 

# The webpage URL whose table we want to extract 
url = "https://www.geeksforgeeks.org/extended-operators-in-relational-algebra/"

# Assign the table data to a Pandas dataframe 
table = pd.read_html(url)[0] 

# Store the dataframe in Excel file 
table.to_excel("data.xlsx") 

Как видно из приведенного выше кода, программа переходит на указанный URL, но в На моей веб-странице, если URL-адрес был достигнут, все данные пропали (после обновления страницы sh), потому что я генерирую количество строк и столбцов в go без обновления страницы sh.

Может кто-нибудь предложить альтернативный подход для экспорта в Excel таблицы HTML с использованием python?

1 Ответ

0 голосов
/ 24 февраля 2020

Не передавайте URL, передайте необработанную строку, содержащую html:

Параметры:

io: (str, path object или файлоподобный объект)

URL, файлоподобный объект или необработанная строка, содержащая HTML. Обратите внимание, что l xml принимает только протоколы http, ftp и url файла. Если у вас есть URL, начинающийся с «https», вы можете попробовать удалить «s».

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_html.html

...