Использование селена в python для извлечения значений в этой форме - PullRequest
1 голос
/ 30 марта 2020

Как извлечь значение из файла html в этой форме, используя selenium:

<body>
   <div class="some stuff">
      <span class="some other stuff">the number wanted</span>
   </div>
</body>

Я пытался использовать функцию get_attribute для элемента, но он может только возвращать класс.

Код до сих пор

from selenium import webdriver
from selenium.webdriver.common.keys import Keys

driver = webdriver.Chrome()
driver.get("website")
elem = driver.find_element_by_xpath('xpath to wherever')
print(elem.get_attribute("value")) #tried originally
driver.close()

Также важно отметить, что веб-сайт должен быть подписан на конкретном веб-сайте, который я пытался, не будет работать для большинства людей. Спасибо за любую помощь.

Ответы [ 2 ]

1 голос
/ 30 марта 2020

Другой подход, который вы можете использовать .get_attribute("innerHTML"), он может использоваться для получения текста внутри тега span.

В то время как .get_attribute ("value") может использоваться для других типов компонентов, таких как input

1 голос
/ 30 марта 2020

Если ваши данные находятся в пределах , вы можете использовать .text для получения внутреннего текста элемента.

from selenium import webdriver
from selenium.webdriver.common.keys import Keys

driver = webdriver.Chrome()
driver.get("website")
elem = driver.find_element_by_xpath('xpath to wherever')
print(elem.text) #Get the inner text of elem
driver.close()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...