HTMLAgilityPack Выбор узлов между комментариями - PullRequest
8 голосов
/ 01 сентября 2011

Я заменяю некоторый головной скрипт, который относится к определенному виджету.Я хочу иметь возможность найти все узлы, относящиеся к этому виджету, расположенные между комментариями.Кроме того, я хочу легко удалить любой код, связанный с указанным виджетом (включая начальный и конечный комментарий.

Вставленный и удаленный код будет выглядеть следующим образом:

<!-- WidgetScript_WidgetName -->

  <script src="Widgets/jquery.somecode.js" type="text/javascript"></script>
  <script type="text/javascript">   
    $(function () {
        $('.someid).dothis({parameter, avatar_size: 48, count: 6});
      });
    </script>
    <link href="Widgets/jquery.somecode.css" media="all" rel="stylesheet" type="text/css"/> 

<!--WidgetScript_WidgetName End-->

Ответы [ 2 ]

10 голосов
/ 02 сентября 2011

Попробуйте использовать следующее:

var startNode = document.DocumentNode.SelectSingleNode("//comment()[contains(., 'WidgetScript_WidgetName')]");
var endNode = document.DocumentNode.SelectSingleNode("//comment()[contains(., 'WidgetScript_WidgetName End')]");
int startNodeIndex = startNode.ParentNode.ChildNodes.IndexOf(startNode);
int endNodeIndex = endNode.ParentNode.ChildNodes.IndexOf(endNode);

var nodes = startNode.ParentNode.ChildNodes.Where((n, index) => index >= startNodeIndex && index <= endNodeIndex).Select(n => n);
3 голосов
/ 02 сентября 2011

Я бы предложил что-то вроде этого:

        var head = document.DocumentNode.SelectSingleNode("html/head");

        var nodes = new List<HtmlNode>();

        bool isComment = false;
        foreach (var node in head.ChildNodes.ToList())
        {
            if (node.NodeType == HtmlNodeType.Comment &&
                node.InnerText.Contains("WidgetScript_WidgetName"))
            {
                isComment = !isComment;
                node.Remove();
            }
            else if (isComment)
            {
                nodes.Add(node);
                node.Remove();
            }
        }

        Console.WriteLine(head.InnerHtml);

Это удаляет каждый узел между двумя комментариями (и самими комментариями).

...