Ошибка libxml2 с пространствами имен и xpath - PullRequest
12 голосов
/ 28 июня 2010

Я вставляю здесь некоторый код, который компилируется без предупреждения, используя gcc file.c -lxml2, предполагая, что libxml2 установлен в вашей системе.

#include <libxml/parser.h>
#include <libxml/xpath.h>
#include <assert.h>
#include <libxml/tree.h>
#include <libxml/xpathInternals.h>

xmlDocPtr
getdoc (char *docname) {
    xmlDocPtr doc;
    doc = xmlParseFile(docname);

    if (doc == NULL ) {
        fprintf(stderr,"Document not parsed successfully. \n");
        return NULL;
    }

    return doc;
}

xmlXPathObjectPtr
getnodeset (xmlDocPtr doc, xmlChar *xpath){

    xmlXPathContextPtr context;
    xmlXPathObjectPtr result;

    context = xmlXPathNewContext(doc);
    if (context == NULL) {
        printf("Error in xmlXPathNewContext\n");
        return NULL;
    }

    if(xmlXPathRegisterNs(context,  BAD_CAST "new", BAD_CAST "http://www.example.com/new") != 0) {
        fprintf(stderr,"Error: unable to register NS with prefix");
        return NULL;
    }

    result = xmlXPathEvalExpression(xpath, context);
    xmlXPathFreeContext(context);
    if (result == NULL) {
        printf("Error in xmlXPathEvalExpression\n");
        return NULL;
    }
    if(xmlXPathNodeSetIsEmpty(result->nodesetval)){
        xmlXPathFreeObject(result);
                printf("No result\n");
        return NULL;
    }
    return result;
}

int
main(int argc, char **argv) {

    char *docname;
    xmlDocPtr doc;
    xmlChar *xpath = (xmlChar*) "/new:book/section1";
    xmlNodeSetPtr nodeset;
    xmlXPathObjectPtr result;
    int i;
    xmlChar *keyword;

    if (argc <= 1) {
        printf("Usage: %s docname\n", argv[0]);
        return(0);
    }

    docname = argv[1];
    doc = getdoc(docname);
    result = getnodeset (doc, xpath);
    if (result) {
        nodeset = result->nodesetval;
        for (i=0; i < nodeset->nodeNr; i++) {
            keyword = xmlNodeListGetString(doc, nodeset->nodeTab[i]->xmlChildrenNode, 1);
        printf("keyword: %s\n", keyword);
        xmlFree(keyword);
        }
        xmlXPathFreeObject (result);
    }

    xmlFreeDoc(doc);
    xmlCleanupParser();
    return (1);
}

Моя проблема в том, что я хочу проанализировать следующий xml

<?xml version="1.0" encoding="UTF-8"?>
<book xmlns="http://www.example.com/new">
    <section1>Sec_1</section1>
    <section2>Sec_2</section2>
</book>

элемент book, определяющий пространство имен внутри этого элемента.Я хочу напечатать значение в xpath / book / section1, и оно возвращает NULL.Когда я пытаюсь вернуть элемент в пространство имен, я также получаю сообщения об ошибках, т.е. / new: book / section1

. Я предполагаю, что мой код не работает, потому что я не правильно использую префиксы пространства имен.У меня заканчивается время.Не могли бы вы помочь?

Ответы [ 3 ]

28 голосов
/ 12 августа 2010

Оказывается, как я узнал из здесь , на самом деле это не сбой libXml, это проблема, потому что libXml правильно соответствует спецификациям XML / XPATH.

Решения, предложенные Р. Бурдо, верны, однако, если у вас есть контроль над анализируемым XML-документом.

Контекст для запроса XPATH - независимых квалификаторов пространства именв документе XML.Пространство имен по умолчанию заставляет все дочерние теги в пространстве имен;им не требуется указывать в документе , но должен быть квалифицированным в запросе xpath.К счастью, вы зарегистрировали пространство имен как new в libXml, поэтому решение cateof должно работать.

xmlXPathRegisterNs(context,  BAD_CAST "new", BAD_CAST "http://www.example.com/new"

xmlChar *xpath = (xmlChar*) "/new:book/new:section1";

Я привожу здесь xml для наглядности:

<?xml version="1.0" encoding="UTF-8"?>
<book xmlns="http://www.example.com/new">
    <section1>Sec_1</section1>
    <section2>Sec_2</section2>
</book>
3 голосов
/ 01 августа 2010

Это досадный сбой библиотеки libXml.Как отмечает cateof, проблема заключается в объявлении пространства имен по умолчанию:

xmlns = "http://www.example.com/new"

Два варианта:
(1) избавиться от этого объявления в теге book или (2)дайте ему имя и используйте это имя в своих тегах.

например

xmlns: new = "http://www.example.com/new"

Тогда все ваши теги выглядят так:

new: book new: section1

и т. д.

2 голосов
/ 28 июня 2010

это проблема с пространством имен по умолчанию.Для соответствия пути вам нужно / new: tag / new: tag и т. Д.

...