Не удается получить доступ ко всем строкам динамически генерируемой таблицы - PullRequest
0 голосов
/ 28 августа 2018

Справочная информация

Я пытаюсь построить веб-скребок, используя PowerShell и COM-объект Internet Explorer. Цель веб-скребка - собрать данные из определенной таблицы на странице и сохранить их для последующего использования в сценарии.

Мне не принадлежит веб-сайт, но я считаю, что это приложение ReactJS, и таблица загружается динамически при загрузке страницы. Ниже мой код на данный момент: ('domains-name' - это имя класса строк, которые я ищу)

$IE= New-Object -ComObject "InternetExplorer.Application"

$IE.navigate2(“https://www.example.com/control_panel")

while ($IE.busy) {
    start-sleep -milliseconds 1000
} 

$IE.visible=$false
$domainAddressArr = [System.Collections.ArrayList]@()

$IE.Document.IHTMLDocument2_body.getElementsByClassName('domains-name') | 
ForEach-Object {
    $a = $_.children[0]
    [void]$domainAddressArr.Add($a.toString())
}

Моя проблема

Это дает мне массив правильной информации, однако в нем отсутствуют 2 строки данных, которые я могу видеть на странице и в инспекторе страниц Chrome. Возможно, это проблема, когда реакция не отображает полную таблицу, пока не произойдет взаимодействие с пользователем? Я попытался добавить 5-секундную паузу перед сканированием страницы, но безуспешно.

Любая помощь будет принята с благодарностью!

...