Я пытаюсь преобразовать два списка в один словарь, чтобы обновить базу данных.
Первый список содержит URL-адреса файлов HTML, а второй список содержит сами файлы HTML.
При попытке преобразовать это я получаю следующий результат:
{'file: / C: /1456110874625203.html ':' [',' file: / C: /1456111318575265.html ': "'"}
Вместо этого результата:
{'file: / C: /1456110874625203.html ': «Здравствуйте, это HTML-файл без тегов», «file: / C: /1456111318575265.html»: «Здравствуйте, это HTML-файл без тегов»}
Таким образом, вместо того, чтобы поместить весь HTML-файл в словарь, я получаю только начало списка (квадратная скобка '[' и последняя часть списка (квота "'").
Как я могу получить весь файл в словарь?
from bs4 import BeautifulSoup as bs
import re
import pandas as pd
import itertools
from collections.abc import Iterable
import pymssql
conn = pymssql.connect(
host='x',
port=x,
user='x',
password='x',
database='x'
)
cursor = conn.cursor()
cursor.execute('SELECT x FROM x')
text = [r[0] for r in cursor.fetchall() ]
conn.close()
conn = pymssql.connect(
host='x',
port=x,
user='x',
password='x',
database='x'
)
cursor = conn.cursor()
cursor.execute('SELECT x FROM x')
t = [r[0] for r in cursor.fetchall() ]
conn.close()
text1 = str(text)
soup = bs(text1, 'html.parser')
autor = soup.get_text()
s = autor.replace('\\n', '')
dictw = dict(zip(t,s))
print (dictw)