Как разобрать HTML сайта с помощью PowerShell - PullRequest
1 голос
/ 28 июня 2019

Я пытаюсь получить некоторую информацию о веб-сайте, я хочу найти определенный тег / класс и затем вернуть содержащееся в нем текстовое значение (innerHTML).Это то, что у меня до сих пор

$request = Invoke-WebRequest -Uri $url -UseBasicParsing
$HTML = New-Object -Com "HTMLFile"
$src = $request.RawContent
$HTML.write($src)


foreach ($obj in $HTML.all) { 
    $obj.getElementsByClassName('some-class-name') 
}

Я думаю, что есть проблема с преобразованием HTML в объект HTML, так как я вижу много неопределенных свойств и пустых результатов, когда я пытаюсь "Выбрать-Объект "их.

Так что, потратив два дня, как я должен анализировать HTML с помощью Powershell?

Так как синтаксический анализ HTML с помощью регулярных выражений такой большойнет, как мне это сделать иначе?Кажется, ничего не работает.

...