Извлечение исходного кода HTML в Excel с использованием VBA - PullRequest
0 голосов
/ 28 сентября 2018

Я пытаюсь просто вставить содержимое или внутренний текст в Excel, используя функцию getElementByID.Контент - это ссылка iframe, которую я пытаюсь извлечь и вставить в ячейку.На фотографии показано исходный код HTML.

 Sub GetData()

    Dim ie As New SHDocVw.InternetExplorer
    Dim htmldoc As MSHTML.HTMLDocument
    Dim result As MSHTML.IHTMLElement


    ie.Visible = True
    ie.navigate "http://www.bursamalaysia.com/market/listed-companies/company-announcements/5925865"

    Do While ie.readyState <> READYSTATE_COMPLETE
    Loop


    Application.Wait (Now() + TimeValue("00:00:016")) ' For internal page refresh or loading

    Set htmldoc = ie.document
    Set Results = HTML.getElementById("bm_ann_detail_iframe")

    Sheets("Sheet1").Range("a1").Value = Results.innerText

End Sub

исходный код HTML

1 Ответ

0 голосов
/ 28 сентября 2018

Вы должны использовать согласованные имена переменных в вашем коде.Если вы поместите Option Explicit вверху вашего кода, это поможет.

Вы хотите получить доступ к атрибуту src iframe, чтобы получить отображаемый URL.

Если вы планируетечтобы использовать новый URL, тогда вы на самом деле хотите, чтобы часть до "#".Это означает изменение на:

ThisWorkbook.Worksheets("Sheet1").Range("A1").Value = Split(ie.document.getElementById("bm_ann_detail_iframe").src, "#")(0)

Код:

Option Explicit
Public Sub GetData()
    Dim ie As New SHDocVw.InternetExplorer
    ie.Visible = True
    ie.navigate "http://www.bursamalaysia.com/market/listed-companies/company-announcements/5925865"

    While ie.Busy Or ie.readyState < 4:  DoEvents:  Wend

     ThisWorkbook.Worksheets("Sheet1") = ie.document.getElementById("bm_ann_detail_iframe").src
    ie.Quit
End Sub
...