Question

Как я могу получить HTML источник в переменной, используя модуль Selenium с Python?

Я хотел сделать что-то вроде этого:

from selenium import webdriver
browser = webdriver.Firefox()
browser.get(raw_input("Enter URL: "))
if "whatever" in html_source:
    # Do something
else:
    # Do something else

Какя могу это сделать?Я не знаю, как получить доступ к источнику HTML.

AutomatedTester · Answer 1 · 23 октября 2011

Вам необходимо вызвать свойство page_source.Смотри ниже.

from selenium import webdriver
browser = webdriver.Firefox()
browser.get(raw_input("Enter URL: "))
html_source = browser.page_source
if "whatever" in html_source:
    # do something
else:
    # do something else

Milanka · Answer 2 · 19 февраля 2013

С Selenium2Library вы можете использовать get_source()

import Selenium2Library
s = Selenium2Library.Selenium2Library()
s.open_browser("localhost:7080", "firefox")
source = s.get_source()

Dhiraj · Answer 3 · 19 ноября 2018

driver.page_source поможет вам получить исходный код страницы. Вы можете проверить, присутствует ли текст в источнике страницы или нет.

from selenium import webdriver
driver = webdriver.Firefox()
driver.get("some url")
if "your text here" in driver.page_source:
    print('Found it!')
else:
    print('Did not find it.')

Если вы хотите сохранить источник страницы в переменной, добавьте строку ниже после driver.get :

var_pgsource=driver.page_source

и измените условие , если , на:

if "your text here" in var_pgsource:

Mahesh Reddy Atla · Answer 4 · 16 декабря 2013

Используя исходный код страницы, вы получите весь HTML-код.
Поэтому сначала определите блок кода или тега, в котором вам требуется получить данные или щелкнуть элемент.

options = driver.find_elements_by_name_("XXX")
for option in options:
    if option.text == "XXXXXX":
        print(option.text)
        option.click()

Вы можете найти элементы по имени, XPath, id, ссылке и пути CSS.

Bob Evans · Answer 5 · 26 октября 2011

Чтобы ответить на ваш вопрос о том, чтобы URL использовать для urllib, просто выполните этот код JavaScript:

url = browser.execute_script("return window.location;")

Griffin · Answer 6 · 22 октября 2011

Я бы порекомендовал получить источник с urllib и, если вы собираетесь анализировать, используйте что-то вроде Beautiful Soup .

import urllib

url = urllib.urlopen("http://example.com") # Open the URL.
content = url.readlines() # Read the source and save it to a variable.

Python Selenium доступ к исходному тексту HTML

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 6 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Python Selenium доступ к исходному тексту HTML

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 6 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов