У меня есть старый веб-сайт, первоначально созданный в MS Frontpage, который я пытаюсь дефронтировать.Я написал скрипт BeautifulSoup, который делает большую часть этого.Осталось только удалить пустые таблицы, например таблицы без текстового содержимого или данные в любых их тегах td
.
Проблема, на которой я застрял, состоит в том, что то, что я до сих пор пробовал, удаляет таблицу, если хотя бы один из ее тегов td
не содержит данных, даже если это делают другие.При этом удаляются все таблицы во всем документе, включая таблицы с данными, которые я хочу сохранить.
tags = soup.findAll('table',text=None,recursive=True)
[tag.extract() for tag in tags]
Любые предложения по удалению только таблиц, в которых нет тегов td содержат любыеданные?(Мне все равно, если они содержат img
или пустые теги привязки, если нет текста).