Я пытаюсь читать и извлекать данные из файлов xls, которые на самом деле являются веб-страницами с одним файлом, см. Ниже
This document is a Single File Web Page, also known as a Web Archive file.
Я пытаюсь выяснить значение всех тегов, чтобы убедиться, что я правильно их анализирую, используя lxml.
Например, вот пример тега:
<th class=3Dtl colspan=3D1 rowspan=3D2
Пока я успешно работаю с несколькими файлами, с которыми я играю, я хочу попытаться выяснить, делаю ли я предположения, которые позже вернутся, чтобы преследовать меня. Таким образом, список этих тегов и их значение были бы великолепны.