Сценарий: у меня есть файл HTML, который содержит данные в следующем формате:

Где сравниваются два разных файла и сохраняется результатв HTML (красная метка появляется, когда значения отличаются между ними).
Цель: Я пытаюсь преобразовать эти HTML-данные в более читаемый формат. В этом случае я пытаюсь прочитать его в окна TkInter, с полосами прокрутки, где их можно легко сравнить.
Проблема: При синтаксическом анализе данных из файла html (как с BeautifulSoup илиПанды) Я могу получить необработанные данные в виде строк или более чистую версию данных. Но все же, передавая это в TkInter, я теряю форматирование, которое наблюдалось в HTML-файле (например, красный цвет при различиях).
Вопросы: Как лучше всегоделать такую интерпретацию? Как я могу избежать потери своих атрибутов / или как я могу правильно перемещать данные в панды, чтобы потом я мог выводить их в TkInter?
Дополнительный вопрос: Есть ли лучший способ выполнить этоКакое задание?
Что я получил до сих пор:
with open(r"C:\Users\DGMS\Downloads\Projects\Python\report_1007949.html") as f:
filename1 = f.read()
try:
from BeautifulSoup import BeautifulSoup
except ImportError:
from bs4 import BeautifulSoup
parsed_html = BeautifulSoup(filename1)
# get text
text = parsed_html.get_text()
import pandas as pd
aaah = pd.read_html(filename1)
print(aaah[0])
bbbh = aaah[0]
import tkinter as tk
root = tk.Tk()
root.state('zoomed')
y1scrollbar = tk.Scrollbar(root)
y1scrollbar.pack(side=tk.RIGHT, fill=tk.Y)
template1 = tk.Text(root, height=5, width=117, wrap=tk.NONE, yscrollcommand=y1scrollbar.set)
template1.pack(side=tk.RIGHT, fill=tk.Y)
template1.insert(tk.END, parsed_html)
tk.mainloop()
Obs1: В этом случае я попытался распечатать оба к TK, норезультат был неверным в обоих случаях.
Obs2: Из всего, что я мог найти в Google, и в других вопросах в SO, я не мог понять, как правильно выполнить такой анализ,так что я действительно не знаю, возможно ли это вообще.