Отказ от ответственности: я знаю, что при извлечении динамически сгенерированного контента с помощью веб-драйвера возникают определенные издержки, но этот вопрос касается возможности синтаксического анализа каждого языка. Если вы собираетесь проголосовать за мой вопрос, было бы хорошо, если бы вы могли оставить объяснение!
Простой вопрос: Является ли разбор с одним каркасом более эффективным, чем с другим?
from scrapy.http import HtmlResponse
browser.get(request.url)
Передача динамического содержимого в Scrapy для анализа
body = browser.page_source
response = HtmlResponse(browser.current_url, body=body, encoding='utf-8', request=request)
whatever = response.xpath('//whatever')
Синтаксический анализ с селеном
browser.get(request.url)
whatever = browser.find_elements_by_xpath('//whatever')
Является ли один язык более эффективным, чем другой, при эффективности синтаксического анализа или разница незначительна, когда Selenium получает динамический контент?
Одна из причин, по которой я спрашиваю, состоит в том, что я считаю, что Scrapy гораздо проще в использовании & mdash; намного приятнее синтаксис & mdash; так что я бы, конечно, перешел через page_source
, чтобы разобраться с Scrapy, если это не повлияет или не окажет существенного влияния на эффективность моего паука.