for line in text:
line=line.strip().split()
d={}
bad=[i for i in line if len(i)<=3]
print(bad)
for i in line:
a=""
for j in i:
if j.isalpha():
a+=j
if a not in bad:
a=a.capitalize()
if a not in d:
d[a]=0
d[a]+=1
else:
d[a]+=1
print (d)
Я пытаюсь взять файл html в качестве ввода, используя имя "text", а остальная часть кода предназначена для создания слова, используя слова с их количеством. Можете ли вы предложить мне способы принять html файл в качестве ввода.