pandas.read_html () занимает слишком много времени, чтобы вернуть список таблиц в последнее время, если размер html> 5 МБ.если есть только несколько таблиц, pd.read_html () возвращает список мгновенно, но если в нем 10 таблиц, то его принятие будет длиться вечно.это никогда не было проблемой раньше.Я построил весь мой проект на основе этого.и теперь все обанкротилось, потому что где-то что-то взорвалось внутри, и никто, кажется, не беспокоится.Я не могу предоставить какие-либо данные (конфиденциально, иначе у меня не возникло бы проблемы и я не могу найти ни одного веб-сайта, у которого есть несколько таблиц (> 5) на одной странице. Есть одна или две таблицы или изображения таблиц.) Дляпродублируйте код, но можете объяснить, как его воссоздать.
import pandas as pd
file=r'_path_to_html_file' # this file should be a large (>5 mb with mutliple tables >5)
#else the problem wont be triggered
tables=pd.read_html(file)
# this will return a list within a second usually a couple of months ago when i finished my project.
#but of late it takes forever(>30-40 minutes for a 16 mb html file) to do so.