Использование словарей с Python для очистки определенных данных - PullRequest
0 голосов
/ 04 июля 2019

У меня есть скрипт, который успешно запускается, очищает данные и сохраняет данные.Но проблема в том, что я не хочу все виды данных, поэтому я хотел использовать словари, чтобы получить релевантные данные, которые нужны только для. Например, я хочу номер телефона, по электронной почте и т. Д., Так что мой словарь выглядит так

check_detail_of_vendors = ["line","phone","email","posts","followers","following"]

, который я хочу проверить с извлеченной информацией и распечатать строки, у которых есть ключевые слова, описанные в словаре.Только близко я могу добраться до моего кода.Может ли кто-нибудь, пожалуйста, вести в правильном направлении.

from selenium import webdriver
from bs4 import BeautifulSoup as bs
import csv
import requests

contents =[]

#dictionary
check_detail_of_bad =   
["line","phone","email","posts","followers","following"]

save_path = 'bad_mad.txt'



filename = 'link_business_filter.csv'

????Я хочу проверить, совпадают ли строки словаря со списком данных

def check():
    for y in script3:
        if y == check_detail_of_vendors:
             print(check_detail_of_vendors)
             return







with open(filename,'rt') as f:
    data = csv.reader(f)
    for row in data:
        links = row[0]
        contents.append(links)

copy_html = open('new.json','a')

for link in contents:
    url_html = requests.get(link)
    print(link)
    browser = webdriver.Chrome('chromedriver')
    open = browser.get(link)
    source = browser.page_source
    data = bs(source,"html.parser")
    body = data.find('body')
    script = body
    x_path = '//*[@id="react-root"]/section/main/div'
    script2 = browser.find_element_by_xpath(x_path)
    script3 = script2.text

    string_open = "" + str(check()) + "\n"
    copy_html.write(string_open)

    #script2.send_keys(keys.COMMAND + 't')
    browser.close()
    print(script3)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...