Как получить все элементы ввода в форме с помощью HtmlAgilityPack, не получая нулевую ссылку - PullRequest
23 голосов
/ 05 марта 2010

Пример HTML:

 <html><body>
     <form id="form1">
       <input name="foo1" value="bar1" />
       <!-- Other elements -->
     </form>
     <form id="form2">
       <input name="foo2" value="bar2" />
       <!-- Other elements -->
     </form>   
 </body></html>

Тестовый код:

HtmlDocument doc = new HtmlDocument();
doc.Load(@"D:\test.html");
foreach (HtmlNode node in doc.GetElementbyId("form2").SelectNodes(".//input"))
{
    Console.WriteLine(node.Attributes["value"].Value);            
}

Утверждение doc.GetElementbyId("form2").SelectNodes(".//input") дает мне нулевую ссылку.

Что-то я не так сделал? спасибо.

Ответы [ 2 ]

42 голосов
/ 05 марта 2010

Вы можете сделать следующее:

HtmlNode.ElementsFlags.Remove("form");

HtmlDocument doc = new HtmlDocument();

doc.Load(@"D:\test.html");

HtmlNode secondForm = doc.GetElementbyId("form2");

foreach (HtmlNode node in secondForm.Elements("input"))
{
    HtmlAttribute valueAttribute = node.Attributes["value"];

    if (valueAttribute != null)
    {
        Console.WriteLine(valueAttribute.Value);
    }
}

По умолчанию HTML-пакет Agility Pack анализирует формы как пустой узел, поскольку им разрешено перекрывать другие элементы HTML.Первая строка (HtmlNode.ElementsFlags.Remove("form");) отключает это поведение, позволяя получать элементы ввода во второй форме.

Обновление: Пример перекрытия элементов формы:

<table>
<form>
<!-- Other elements -->
</table>
</form>

Элемент начинается внутри таблицы, но закрывается за пределами элемента таблицы.Это разрешено в спецификации HTML, и HTML Agility Pack должен иметь с ней дело.

0 голосов
/ 25 сентября 2018

Просто получите их в массиве:

HtmlNodeCollection resultCollection = doc.DocumentNode.SelectNodes("//*[@type='text']");
...