Селен, красивый суп - PullRequest
       0

Селен, красивый суп

0 голосов
/ 05 января 2020

Я пытаюсь найти название компании в базе данных, а затем загрузить записи компании, используя Selenium. Проблема в том, что когда я ищу компанию, иногда появляется несколько похожих результатов / компаний, поэтому я не могу написать Selenium, чтобы каждый раз выбирать один и тот же статически. Как я могу определить все результаты, а затем выбрать «наиболее похожий» вариант.

Например, если бы я искал объект "Bowman Real Estate LL C", браузер вернул бы три результата в таблице "Bowman Real Estate LL C", "Bowman Real Estate and Development LL" C "и" Bowman Real Estate & Development Group LL C "

Мне нужно иметь возможность определить все параметры в источнике страницы, затем определить, какие из них наиболее похожи, и нажать на них, чтобы перейти к следующей страница и скачать. Это все, что у меня есть:

driver.get('https://www.sosnc.gov/search/index/corp')
entity = "BOWMAN REAL ESTATE LLC"

try:
    WebDriverWait(driver, delay).until(EC.presence_of_element_located((By.XPATH,'//*[@id="SearchCriteria"]')))
    driver.find_element_by_xpath('//*[@id="SearchCriteria"]').send_keys(entity)
    driver.find_element_by_xpath("//*[@id='SubmitButton']").click()

except TimeoutException:
    print("Loading took too much time! - 1")

try:
    web_url = driver.page_source
    soup = bs.BeautifulSoup(web_url, 'html.parser')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...