У меня есть скрипт, который успешно запускается, очищает данные и сохраняет данные.Но проблема в том, что я не хочу все виды данных, поэтому я хотел использовать словари, чтобы получить релевантные данные, которые нужны только для. Например, я хочу номер телефона, по электронной почте и т. Д., Так что мой словарь выглядит так
check_detail_of_vendors = ["line","phone","email","posts","followers","following"]
, который я хочу проверить с извлеченной информацией и распечатать строки, у которых есть ключевые слова, описанные в словаре.Только близко я могу добраться до моего кода.Может ли кто-нибудь, пожалуйста, вести в правильном направлении.
from selenium import webdriver
from bs4 import BeautifulSoup as bs
import csv
import requests
contents =[]
#dictionary
check_detail_of_bad =
["line","phone","email","posts","followers","following"]
save_path = 'bad_mad.txt'
filename = 'link_business_filter.csv'
????Я хочу проверить, совпадают ли строки словаря со списком данных
def check():
for y in script3:
if y == check_detail_of_vendors:
print(check_detail_of_vendors)
return
with open(filename,'rt') as f:
data = csv.reader(f)
for row in data:
links = row[0]
contents.append(links)
copy_html = open('new.json','a')
for link in contents:
url_html = requests.get(link)
print(link)
browser = webdriver.Chrome('chromedriver')
open = browser.get(link)
source = browser.page_source
data = bs(source,"html.parser")
body = data.find('body')
script = body
x_path = '//*[@id="react-root"]/section/main/div'
script2 = browser.find_element_by_xpath(x_path)
script3 = script2.text
string_open = "" + str(check()) + "\n"
copy_html.write(string_open)
#script2.send_keys(keys.COMMAND + 't')
browser.close()
print(script3)