Я пытаюсь очистить таблицу от веб-сайта, и мой окончательный вывод должен быть табличными данными из первого столбца .
Таблица структурирована так, как показано на рисунке ниже:
Интересующие меня строки находятся под классами row
и alt
.
Выполнение приведенного ниже кода также приводит к получению трех ненужных ячеек: одна из первой строки align = "right"
, одна из второй строки class="gna"
и одна из последней строки, которая настроена точно так же, как и первая строка - align = "right"
.
wb := ComObjCreate("InternetExplorer.Application")
wb.Visible := True
wb.Navigate("C:\Users\Marian\Downloads\webpage.htm")
; Wait for page to load:
While wb.Busy or wb.ReadyState != 4
Sleep, 100
Table := wb.document.getElementById("gvSearchResults")
Rows := Table.rows
Loop % rows.length
{
cells := rows[A_Index-1].cells
out .= cells["0"].innerText ","
out := RTrim(out,",") "`n"
}
Msgbox, %out%
Как можно добавить больше фильтров к выходу, чтобы ограничить результаты только требуемыми ячейками? Спасибо!
LE: Я думаю, что getElementsbyClassname
и queryselectorall()
не работают, потому что протокол html для этой веб-страницы их не поддерживает.
HTML-код начинается с:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<!-- saved from url=(0021)http://www.google.com --> ;This was adapted according to the comment section
<HTML><HEAD><META content="IE=7.0000" http-equiv="X-UA-Compatible">
<TITLE>ECSD |>> Files</TITLE>