Есть ли способ превратить HTML элементов в переменные в python - PullRequest
0 голосов
/ 26 апреля 2020

Я новичок в HTML в общем, я просто хотел сделать автоматизированный скрипт. Я сделал некоторый код, используя HTML парсер в python. Я хотел знать, могу ли я превратить свой вывод в переменные без необходимости писать собственную форму компилятора? Если бы кто-то мог сказать мне, какую информацию я смотрю, или если бы кто-то мог указать мне тип библиотеки, которую я ищу, это было бы здорово.

Вот мой код

from html.parser import HTMLParser
from html.entities import name2codepoint
import codecs

class MyHTMLParser(HTMLParser):
    def __init__(self, *, convert_charrefs=True):
        self.convert_charrefs = convert_charrefs
        self.output = "";
        self.reset()

    def handle_data(self, data):
        if ("@type\": \"Movie" in data):
            #print("Encountered some data  :", data)
            self.output = data

    def getOutput(self):
        return self.output


f=codecs.open("Joker (2019) - IMDb.html", 'r')
code = f.read()
parser = MyHTMLParser()
parser.feed(code)
parser.feed(parser.getOutput())
print(parser.getOutput())

Вот мой вывод

      "@context": "http://schema.org",
  "@type": "Movie",
  "url": "/title/tt7286456/",
  "name": "Joker",
  "image": "https://m.media-amazon.com/images/M/MV5BNGVjNWI4ZGUtNzE0MS00YTJmLWE0ZDctN2ZiYTk2YmI3NTYyXkEyXkFqcGdeQXVyMTkxNjUyNQ@@._V1_.jpg",
  "genre": [
    "Crime",
    "Drama",
    "Thriller"
  ],
...