Селен не может найти текст на странице - PullRequest
0 голосов
/ 19 апреля 2020

HTML:

<div class="col-md-8 no-padding-991" id="status">
  <b>Area:</b>
  157 Meters
  <sup>2</sup>
  | 1689.93 Feet
  <sup>2</sup>
  | 0.02 Ha | 0.04 Acres | 0 Miles
  <sup>2</sup> 
  | 0 Km
  <sup>2</sup>
  <br>
  <b>Perimeter:</b>
  56.06 Meters | 0.06 Km | 0.03 Miles | 184 Feet | 61.00 Yards 
</div>

Я пытаюсь получить это значение из тега Area: по какой-то причине, когда запускаю этот код:

print("scraping calc maps")
driver.get(url)

building_specs = driver.find_element_by_id("status")
print("Building specs")
print(building_specs.text)

Тянет только "Область: -", без цифр.

Спасибо за помощь!

Ответы [ 2 ]

1 голос
/ 20 апреля 2020

Попробуйте сделать:

print("scraping calc maps")
driver.get(url)

building_specs =   driver.find_element_by_id("status")
print("Building specs")
print(building_specs.get_attribute('innerHTML'))
0 голосов
/ 20 апреля 2020

Причина в том, что атрибут .text возвращает только первый найденный текстовый литерал. Чтобы получить объединенный текст всех дочерних узлов, вы можете запросить атрибут innerHTML или innerText:

# get child HTML
print(building_specs.get_attribute("innerHTML"));
# get child Text
print(building_specs.get_attribute("innerText"));
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...