Я пытаюсь проанализировать отчет AWR, чтобы получить долгосрочную информацию SQL, в этом отчете содержится более 40 таблиц, в которых все таблицы имеют один и тот же класс, но разные сводки. Что касается синтаксического анализа, BS4 на Python смог найти несколько таблиц, но одна таблица со всей информацией SQL имеет сводку с новой строкой и пробелом, как показано ниже:
HTML-тег из файла AWR:
<table border="0" class="tdiff" summary="This table displays the text of the SQL statements which have been
referred to in the report">
<tbody><tr><th class="awrbg" scope="col">SQL Id
Я пытался использовать BS4 find()
, чтобы найти эту таблицу, но она терпит неудачу каждый раз. Любая помощь будет высоко оценена.
from bs4 import BeautifulSoup as BS4
awrFile='/XXXXXXXXXXXXXXXXXXX/test/XXXXXXXXXXDB69-1.html'
f_awr = open(awrFile, 'r')
soup = BS4(f_awr, 'html.parser')
sqlTextInfoTable = soup.find('table', {'summary':'This table displays the text of the SQL statements which have been referred to in the report'})
print(sqlTextInfoTable)
это отпечатки None
.