Я пытаюсь создать макрос для получения внутреннего текста с внутренней веб-страницы. Я не уверен в том, как правильно определить местонахождение текста, и был бы признателен за некоторые указания и, возможно, за объяснение подхода.

Я пробовал многочисленные варианты использования getelementsby / tagname / classname безрезультатно. Я не уверен, что понимаю логику определения местоположения после использования функции проверки.

Var = ie.document.getelementClassName("sections").getElementsByTagName("table").Item(0).innerText

'also tried
Var = ie.document.getelementClassName("sections").getElementsByTagName("table").Item(1).getElementsByTagName("tr").Item(2).getElementsByTagName("td").Item(0).innerText

Var = ie.document.getelementTagName("section").getElementsByTagName("table").Item(1).getElementsByTagName("tr").Item(2).getElementsByTagName("td").Item(0).innerText

ActiveCell.Offset(0, 1).Value = Var
    <div class="preloader" style="display: none;"><div class="loaded" style="display: none;">&nbsp;</div></div>
    <div class="container">
        <h2 align="center">Search Job</h2>
        <div class="col-md-6 col-md-offset-3 col-sm-6 col-xs-12">
            <p align="center">Description of this view, testing space and top bar at the same time</p>
            <p align="center">There are some hiding fields due to the web space, if you want to see them click on export</p>
            <p align="center">Description of this view, testing space and top bar at the same time</p>
            <p align="center">Description of this view, testing space and top bar at the same time</p>

<section class="sections">
    <div class="portfolio">
        <div align="center" class="portfolio-item">
            <h5 align="center">Job Number </h5><input id="PPNumber" name="PPNumber" type="text" value="P23315"><br>
            <a onclick="submitdata();" href="#" class="btn btn-primary">Search </a>


                <div style="float:left"><h3 align="left">JOB</h3></div>
                <table class="table" style="font-size:11px;">
                            Job #
                        <th width="20%">
                            Job Name
                            Total Pieces
                        <th width="5%">
                            Day 40 On
                        <th width="5%">
                            Logistics Processed
                        <th width="5%">
                            IQ Status
                            MustMail Comments
                            Total Batch Completed
                            Actual Status

<a href="/Report/Batchdetail/P23315-010" target="_blank">P23315-010</a>                            </td>
                            <td width="20%">
                                ATLANTICA YIELD PLC      <----****I NEED THIS****               
                            <td width="5%">
                            <td width="5%">
                            <td width="5%">
                                MUST MAIL 5/14
                                11 out of 11
                                    Foreign Client
                                                <a class="btn btn-default" href="/Report/Reopenjob?jobnumber=P23315&amp;jobref=P23315-010">Reopen Job</a>

function submitdata(){

    var valtext = $("#PPNumber").val();//you can do also by  getelementbyid
    window.location.href = '/Report/Search/' + valtext;

function ShowMessage() {
    var result = prompt("Please insert a comment if required.", "");
    if (result == null) {
        return false; //break out of the function early
    document.getElementById('comments').value = result;
    return true;


ошибка 438

Вот общая логика доступа к ячейкам таблицы HTML:

Sub test()
Dim sht As Worksheet
Dim doc As New HTMLDocument
Dim targetTable As HTMLTable
Set sht = ThisWorkbook.Worksheets("Sheet1")
doc.body.innerHTML = sht.Range("M1") 'I just stored the html code in cell M1 as a string for the sake of demonstration

Set targetTable = doc.getElementsByClassName("table")(0) 'Get the first element from a collection of elements whose class name is "table"
Debug.Print targetTable.Rows(0).Cells(0).innerText 'Get the first row from the collection of rows that belong to the table and the first cell from the collection of cells that belong to this row.
End Sub

Приведенный выше код выведет Job # в ближайшем окне.Это внутренний текст первой ячейки первой строки (заголовок первого столбца).Вы можете получить остальные значения соответственно.

Вещи для запоминания:

  1. doc.getElementsByClassName("table") - это набор элементов, имя класса которых - "table"
  2. То же самое относится к .getElementsByTagName и т. Д.
  3. Первый элемент в коллекции имеет индекс 0
  4. . Вы можете просмотреть все элементы в коллекции, используя For-Each* 1020.*
  5. Это .getelementClassName неверно
  6. Это doc.getElementsByClassName("table")(0).getElementsByTagName("td")(0).innerText правильно
  7. Вы можете получить доступ к элементу в коллекции как doc.getElementsByClassName("Something").Item(0) или как doc.getElementsByClassName("Something")(0)
Эти возвращаемые коллекции, которые вы затем индексируете, например,

ie.document.getElementsByClassName("className")(0)  'first element

Внесение этих изменений должно обработать вашу первоначальную ошибку.

Ориентация на конкретную строку и столбец:

Вы можете использовать nth-of-typeесли автоматизация с IE, то есть tr:nth-of-type(rowNumberHere), td:nth-of-type(columnNumberHere).

Я думаю, что вы после первого столбца второго ряда, поэтому я бы использовал селекторы CSS

ie.document.querySelector(".table tr:nth-of-type(2) td:nth-of-type(1)").innerText

Современные браузеры оптимизированы для CSSселекторы, так что это должен быть эффективный метод.

Вся таблица:

Простой способ скопировать всю таблицу - использовать буфер обмена

Option Explicit
Public Sub GetInfo()
    Dim ie As New InternetExplorer, url As String, ws As Worksheet
    Dim t As Date, clipboard As Object, hTable As Object
    url = "url"
    Const MAX_WAIT_SEC As Long = 10

    Set ws = ThisWorkbook.Worksheets("Sheet1")
    Set clipboard = GetObject("New:{1C3B4210-F441-11CE-B9EA-00AA006B1A69}")

    With ie
        .Visible = True
        .Navigate2 url

        While .Busy Or .readyState < 4: DoEvents: Wend

        With .document

            t = Timer
                On Error Resume Next
                Set hTable = .querySelector(".table")
                On Error GoTo 0
                If Timer - t > MAX_WAIT_SEC Then Exit Do
            Loop While hTable Is Nothing
        End With

        If hTable Is Nothing Then Exit Sub
            clipboard.SetText hTable.outerHTML
    End With
End Sub

Зацикливание строк и столбцов таблицы:

Если вы хотите зациклить строки и столбцы таблицы и записать их, см. здесь .
