я нашел ошибку в libxml2 (утечка памяти при многопоточном разборе)? - PullRequest
6 голосов
/ 06 января 2011

Я работаю над кодом обработки данных, используя libxml2 .Я застрял на утечке памяти, которую невозможно устранить.Вот минимальный код для его генерации:

#include <stdlib.h>
#include <stdio.h>
#include <libxml/parser.h>
#include <libxml/tree.h>
#include <omp.h>

int main(void)
{
    xmlDoc *doc;
    int tn;
    char fname[32];

    omp_set_num_threads(2);
    xmlInitParser();
    #pragma omp parallel private(doc,tn,fname)
    {
        tn  = omp_get_thread_num();
        sprintf(fname,"testdoc%d.xml",tn);
        doc = xmlReadFile(fname,NULL,0);
        printf("document %s parsed on thread %d (%p)\n",fname,tn,doc);
        xmlFreeDoc(doc);
    }
    xmlCleanupParser();

    return EXIT_SUCCESS;
}

Во время выполнения вывод:

document testdoc0.xml parsed on thread 0 (0x1005413a0)
document testdoc1.xml parsed on thread 1 (0x1005543c0)

, подтверждающий, что у нас действительно многопоточность и что doc действительно приватно впараллельная область.Можно заметить, что я правильно применил инструкции по безопасности потоков для использования libxml2 (http://xmlsoft.org/threads.html). Отчеты Valgrind:

HEAP SUMMARY:
    in use at exit: 9,000 bytes in 8 blocks
  total heap usage: 956 allocs, 948 frees, 184,464 bytes allocated

968 bytes in 1 blocks are definitely lost in loss record 6 of 8
   at 0x1000107AF: malloc (vg_replace_malloc.c:236)
   by 0x1000B2590: xmlGetGlobalState (in /opt/local/lib/libxml2.2.dylib)
   by 0x1000B1A18: __xmlDefaultSAXHandler (in /opt/local/lib/libxml2.2.dylib)
   by 0x100106D18: xmlDefaultSAXHandlerInit (in /opt/local/lib/libxml2.2.dylib)
   by 0x100041BE7: xmlInitParserCtxt (in /opt/local/lib/libxml2.2.dylib)
   by 0x100042145: xmlNewParserCtxt (in /opt/local/lib/libxml2.2.dylib)
   by 0x10004615E: xmlCreateURLParserCtxt (in /opt/local/lib/libxml2.2.dylib)
   by 0x10005B56B: xmlReadFile (in /opt/local/lib/libxml2.2.dylib)
   by 0x100000E03: main.omp_fn.0 (in ./xtest)
   by 0x100028FA3: gomp_thread_start (in /opt/local/lib/gcc44/libgomp.1.dylib)
   by 0x1001E8535: _pthread_start (in /usr/lib/libSystem.B.dylib)
   by 0x1001E83E8: thread_start (in /usr/lib/libSystem.B.dylib)

LEAK SUMMARY:
   definitely lost: 968 bytes in 1 blocks
   indirectly lost: 0 bytes in 0 blocks
     possibly lost: 0 bytes in 0 blocks
   still reachable: 8,032 bytes in 7 blocks
        suppressed: 0 bytes in 0 blocks
Reachable blocks (those to which a pointer was found) are not shown.
To see them, rerun with: --leak-check=full --show-reachable=yes

Это работает для меня независимо от того, какой документ XML используется. Я использую libxml 2.7.8, в Mac OS X 10.6.5 с gcc 4.4.5.

Может ли кто-нибудь воспроизвести эту ошибку?

Спасибо,

Антонин

Ответы [ 2 ]

3 голосов
/ 07 января 2011

С веб-сайта, который вы перечислили выше (http://xmlsoft.org/threads.html):

Начиная с версии 2.4.7, libxml2 предоставляет условия для безопасной работы параллельных потоков при параллельном разборе различных документов.

Ваш пример использует xmlReadFile для одного и того же документа (testdoc.xml) для каждого потока. Далее говорится:

Обратите внимание, что безопасность потока не может быть обеспеченадля нескольких потоков, совместно использующих один и тот же документ, блокировка должна выполняться на уровне приложения ...

2 голосов
/ 26 января 2011

Возможно, вам следует упомянуть об этом в списке рассылки libxml2.

http://mail.gnome.org/mailman/listinfo/xml

...