Я пытаюсь соскрести текстовое поле 'активность' с двух страниц здесь и здесь .
Я написал основу кода:
options = Options()
options.binary_location=r'C:\Program Files (x86)\Google\Chrome\Application\chrome.exe'
options.add_experimental_option('excludeSwitches', ['enable-logging'])
#options.add_argument("--headless")
driver = webdriver.Chrome(options=options,executable_path='/mnt/c/Users/kela/Desktop/selenium/chromedriver.exe
url = 'http://www.uwm.edu.pl/biochemia/biopep/peptide_data_page1.php?zm_ID=' + str(i) #where str(i) is either 2500 or 2700 in this example
driver.get(url)
header = driver.find_element_by_css_selector('[name="activity"]')
children = header.find_elements_by_xpath(".//*")
У меня есть две проблемы:
- Мне нужно только извлечь элемент активности, который является «значением, выбранным параметром», я не хочу, чтобы ВСЕ действия возвращались.
- НО, если опция является первым элементом в списке, как в случае с одной из показанных здесь страниц, чья активность - «aami»;'selected value' не является опцией, так как это значение по умолчанию.
Так что я застрял при определении строки или двух кода, который я мог бы добавить в свой скрипт, который будет извлекать:
neuropeptide | ne
alpha-amylase inhibitor | aami
с этих двух веб-страниц, если кто-нибудь может помочь.