Как обработать текст узла XML до первого подузла и после последнего? - PullRequest
2 голосов
/ 01 сентября 2011
<p> Normal text <b> bolded </b> finish normal text </p>

Я обрабатываю этот xml (пример сокращен) с помощью OmniXML (но я считаю, что решение будет применяться к другим анализаторам XML). Я просматриваю xml и каждый раз, когда я обрабатываю тег p или b, я изменяю некоторые настройки шрифта и т. Д.

Проблема в том, что когда у меня есть Node var, указывающий на тег p, и я делаю

Node.TextNode

возвращает «Обычный текст, выделенный жирным шрифтом, обычный текст» - полный текст, но я хочу вернуть только часть до первого тега (а также последнюю часть); Таким образом, когда вы обработаете тэг после этого, я смогу изменить настройки шрифта и напечатать выделенный текст.

Как я могу это сделать?

1 Ответ

3 голосов
/ 01 сентября 2011
uses
  OmniXML,
  OmniXMLUtils;

procedure ProcessNode(const node: IXMLNode; nodeText: TStrings);

  procedure CollectNodes(const node: IXMLNode; const nodeList: IXMLNodeList);
  var
    childNode: IXMLNode;
    iChild   : integer;
  begin
    for iChild := 0 to node.ChildNodes.Length-1 do begin
      childNode := node.ChildNodes.Item[iChild];
      if childNode.NodeType = TEXT_NODE then
        nodeText.Add(childNode.NodeValue)
      else if childNode.NodeType = ELEMENT_NODE then begin
        nodeText.Add(childNode.NodeName);
        CollectNodes(childNode, nodeList);
        nodeText.Add('/' + childNode.NodeName);
      end;
    end;
  end; { CollectNodes }

var
  childNode: IXMLNode;
  nodeList : IXMLNodeList;
begin
  nodeList := TXMLNodeList.Create;
  CollectNodes(node, nodeList);
end; { ProcessNode }

procedure TForm39.FormCreate(Sender: TObject);
var
  xml: IXMLDocument;
  nodeText: TStringList;
begin
  xml := CreateXMLDoc;
  if XMLLoadFromString(xml, '<test><p> Normal text <b> bolded </b> finish normal text </p></test>') then begin
    nodeText := TStringList.Create;
    try
      ProcessNode(xml.SelectSingleNode('test'), nodeText);
    finally FreeAndNil(nodeText); end;
  end;
end;

Даст вам:

p
 Normal text
b
 bolded
/b
 finish normal text
/p
...