утечка памяти в HTML :: TreeBuilder - PullRequest
2 голосов
/ 05 августа 2010

У меня есть некоторый Perl-код:

use HTML::Parse;
use HTML::FormatText;

# ...

my $txtFormatter = HTML::FormatText->new();

while ( ... ) {   # some condition
    my $txt = # get from a file
    my $html_tree = HTML::TreeBuilder->new_from_content($txt);
    $txt = $txtFormatter->format($html_tree);
    $html_tree->delete();
    # write $txt to a file
}

Я заметил, что процесс perl.exe неуклонно увеличивается в размере (до 600 МБ после примерно 2 миллионов итераций цикла). Если я достану материал HTML::TreeBuilder, он вообще не увеличится. Могу ли я что-нибудь сделать, чтобы устранить эту утечку?

1 Ответ

0 голосов
/ 06 августа 2010

Я не могу повторить это с помощью следующего сценария:

#!/usr/bin/perl

use strict; use warnings;

use File::Slurp;
use HTML::FormatText;
use HTML::TreeBuilder;

my $formatter = HTML::FormatText->new;
my $html = read_file 'test.html';

while ( 1 ) {
    my $tree = HTML::TreeBuilder->new_from_content( $html );
    $formatter->format( $tree );
    $tree->delete;
}

Я позволил этому сценарию работать в течение нескольких минут, и использование памяти (в диспетчере задач) оставалось между 7200 и 7300K.

E:\Home> perl -v

This is perl, v5.10.1 built for MSWin32-x86-multi-thread
(with 2 registered patches, see perl -V for more detail)

Copyright 1987-2009, Larry Wall

Binary build 1006 [291086] provided by ActiveState http://www.ActiveState.com
Built Aug 24 2009 13:48:26
E:\Home> perl -MHTML::TreeBuilder -e "print $HTML::TreeBuilder::VERSION"
3.23
E:\Home> perl -MHTML::FormatText -e "print $HTML::FormatText::VERSION"
2.04
...