Nokogiri - это парсер XML и HTML.Он не анализирует CDATA или текстовое содержимое узлов, но может дать вам содержимое, позволяя вам использовать синтаксический анализ строк или регулярное выражение для получения нужных данных.
В случае Javascript, если этовстроенный в страницу, то вы можете получить text
родительского узла.Часто это просто:
js = doc.at('script').text
, если в блоке <head>
страницы есть обычный тег <script>
.Если есть несколько тегов сценария, вам необходимо расширить средство доступа для получения нужного узла, а затем обработать его.
Это становится более захватывающим, когда сценарии загружаются динамически, но вы все равно можете получить данные, проанализировав URLиз параметра src
сценария, затем его извлечения и повторной обработки.
Иногда Javascript внедряется в ссылки других тегов, но это просто еще одно вращение в предыдущих двух методах для получения сценария и обработкиэто.