Я думаю, что я хочу спросить, возможно ли обойти sql: hide (https://docs.microsoft.com/en-us/sql/relational-databases/sqlxml-annotated-xsd-schemas-using/hiding-elements-and-attributes-by-using-sql-hide?view=sql-server-2017),, но я описал мою настоящую проблему ниже на случай, если я ошибаюсь:
I 'я пытаюсь очистить URL-адреса "foo" с веб-сайта с DOM, подобным следующему:
<html>
<body>
<tbody>
<tr>
<a href="foo1">...</a>
<a href="foo2">...</a>
</tr>
</tbody>
<table>
<tbody>
<tr>
<a href="bar1">...</a>
</tr>
<tr>
<a href="bar2">...</a>
</tr>
</tbody>
</table>
</body>
</html>
Всякий раз, когда я пытаюсь print(response.css('a'))
или, что эквивалентно, print(response.xpath('//a'))
, я вижу URL-адреса "foo",но не URL "bar". Кроме того, используя XPath, я могу получить доступ к таблице, но print(response.xpath('//table//*'))
и print(response.xpath('//table//a'))
оба выводят []
.
Возможно ли, что элементы таблицы имеюткак-то скрыт от Scrapy? Как можно решить эту проблему?
Заранее спасибо. Это в основном для интереса, так как URL в любом случае имеют предсказуемую закономерность.