Разбор HTML в TkInter с форматами тегов / атрибутов - PullRequest
0 голосов
/ 29 октября 2019

Сценарий: у меня есть файл HTML, который содержит данные в следующем формате:

enter image description here

Где сравниваются два разных файла и сохраняется результатв HTML (красная метка появляется, когда значения отличаются между ними).

Цель: Я пытаюсь преобразовать эти HTML-данные в более читаемый формат. В этом случае я пытаюсь прочитать его в окна TkInter, с полосами прокрутки, где их можно легко сравнить.

Проблема: При синтаксическом анализе данных из файла html (как с BeautifulSoup илиПанды) Я могу получить необработанные данные в виде строк или более чистую версию данных. Но все же, передавая это в TkInter, я теряю форматирование, которое наблюдалось в HTML-файле (например, красный цвет при различиях).

Вопросы: Как лучше всегоделать такую ​​интерпретацию? Как я могу избежать потери своих атрибутов / или как я могу правильно перемещать данные в панды, чтобы потом я мог выводить их в TkInter?

Дополнительный вопрос: Есть ли лучший способ выполнить этоКакое задание?

Что я получил до сих пор:

with open(r"C:\Users\DGMS\Downloads\Projects\Python\report_1007949.html") as f:
    filename1 = f.read()

try:
    from BeautifulSoup import BeautifulSoup
except ImportError:
    from bs4 import BeautifulSoup

parsed_html = BeautifulSoup(filename1)

# get text
text = parsed_html.get_text()

import pandas as pd
aaah = pd.read_html(filename1)
print(aaah[0])

bbbh = aaah[0]

import tkinter as tk
root = tk.Tk()

root.state('zoomed')

y1scrollbar = tk.Scrollbar(root)
y1scrollbar.pack(side=tk.RIGHT, fill=tk.Y)
template1 = tk.Text(root, height=5, width=117, wrap=tk.NONE, yscrollcommand=y1scrollbar.set)
template1.pack(side=tk.RIGHT, fill=tk.Y)
template1.insert(tk.END, parsed_html)

tk.mainloop()

Obs1: В этом случае я попытался распечатать оба к TK, норезультат был неверным в обоих случаях.

Obs2: Из всего, что я мог найти в Google, и в других вопросах в SO, я не мог понять, как правильно выполнить такой анализ,так что я действительно не знаю, возможно ли это вообще.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...