Разбирая XML-файл с помощью SAX, как я могу создать объект модуля, который эквивалентен значению элемента? - PullRequest
3 голосов
/ 18 ноября 2009

У меня есть разные модули, такие как Author.pm, BillingPeriod.pm, Offer.pm, PaymentMethod.pm и т. Д., Теперь в sax, когда я нажимаю на тег end element, я хочу создать объект модуля, который эквивалентен значению элемента.

Как мне этого добиться?

Например, если я анализирую XML-файл и конечный элемент попадания синтаксического анализатора так, как он должен создать объект Offer.pm, аналогично, если синтаксический анализатор саксофона поражает тег конечного элемента так, как это должно создать объект Author.pm

Код

XML: books.xml

<?xml version="1.0" encoding="UTF-8"?>
<!--Sample XML file generated by XMLSpy v2009 sp1 (http://www.altova.com)-->
<bks:books xsi:schemaLocation="urn:books Untitled1.xsd" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:bks="urn:books">
        <book id="String">
                <author>String</author>
                  <authorFirstName>String</authorFirstName>
                  <authorLastName>String</authorLastName>
                <title>String</title>
                   <titleNo>3</titleNo>
                <genre>String</genre>
                <offer>String</offer>
                <pub_date>1967-08-13</pub_date>
                <review>String</review>
                  <reviewsratings></reviewratings>
        </book>
</bks:books>

саксофон: perlsaxparsing.pl

#!usr/bin/perl -w

use XML::SAX::ParserFactory;
use MySaxHandler;
my $handler = MySaxHandler->new();
my $parser = XML::SAX::ParserFactory->parser(Handler => $handler);
$parser->parse_uri("books.xml")

Например, в приведенном ниже примере, предполагая, что саксофон ударяет Offer end element tag, поэтому создаю объект Offer.pm

Я хочу создать объект из модулей, например, Offer.pm в этом случае, когда sax достигает конечного элемента тега элемента Offer.

  package Offer;
    use strict;

    # This class depicts the product_offer details
    sub new {
        my $class = shift;
        my $self  = {
            _objectId        => shift,
            _price           => shift

        };
        bless $self, $class;
        return $self;
    }

    # Returns the ObjectID
    sub getObjectId {
        my ($self) = @_;
        return $self->{_objectId};
    }


    # Returns the Price
    sub getprice {
        my ($self) = @_;
        return $self->{_price};
    }

    # Check for undefined values and build a insert mapping table
    sub doPreInsetCheck() {
        my ($self) = @_;
        my %refTable;
        if ( defined $self->getObjectId == 1 ) {
            $refTable{'object_id'} = $self->getObjectId;
        }
        if ( defined $self->getprice == 1 ) {
            $refTable{'fk2_price'} = $self->getprice;
        }
        return %refTable;
    }

    # Returns the SQL Statement
    sub getSQLScript {
        my $tableName = 'product_offer';
        my ($self)    = @_;
        my $sqlOutput = "Insert into " . $tableName . "(";
        my %refTable  = $self->doPreInsetCheck();
        my @colNames  = keys %refTable;
        my $ctr;
        foreach ( $ctr = 0 ; $ctr < ( $#colNames + 1 ) ; $ctr++ ) {
            $sqlOutput .= $colNames[$ctr];
            if ( $ctr < $#colNames ) {
                $sqlOutput .= ",";
            }
        }
        $sqlOutput .= ") values (";
        my @colVals = values %refTable;
        foreach ( $ctr = 0 ; $ctr < ( $#colVals + 1 ) ; $ctr++ ) {
            $sqlOutput .= $colVals[$ctr];
            if ( $ctr < $#colVals ) {
                $sqlOutput .= ",";
            }
        }
        $sqlOutput .= ");";
        return $sqlOutput;
    }
    1;

Модуль обработчика парсера SAX: MySaxHander.pm

sub end_element {
    my($self,$data) = @_;
    print "\t Ending element:".$data->{Name}."\n";
    my $obj = new Price("1","2","NL","ENUM","DESCRIPTION","2008-01-01  10:00:00","2009-01-01 10:00:00","2008-01-01 10:00:00","USER");
print $obj->getSQLScript."\n";
$in_books--;
}

Вопрос: При синтаксическом анализе XML-файла с использованием SAX, как я могу создать объект модуля, который эквивалентен значению элемента?

Ответы [ 2 ]

2 голосов
/ 18 ноября 2009

В общем, что вы должны сделать в SAX, это:

  1. Создайте рабочую область при обработке start_element, чтобы хранить значения из вложенных тегов, которые вам в конечном итоге понадобятся для заполнения объекта.
  2. На end_element создать объект

Или вы можете создать экземпляр (пустого) объекта в start_element, а затем обработать вложенные символы characters () и start_element () для его заполнения. Во всех случаях вам нужно будет отслеживать текущее состояние обработки, чтобы вы знали, что делать с каждым типом элемента при его возникновении. Вам также понадобится глобальный контекстный стек, который отслеживает вашу логическую позицию в иерархии и указывает на текущий объект / рабочую область.

Вот указатель на введение , которое решает эти проблемы.

1 голос
/ 19 ноября 2009

Я так устал видеть один и тот же XML снова и снова, что решил дать вам рыбу. Для вашего же блага вы должны приложить больше усилий для объяснения ваших вопросов. Я имею в виду, что даже опубликованный вами XML-файл содержит ошибки.

Код ниже имеет некоторые нетрадиционные аспекты. Они там, так что вам придется выяснить, что происходит, прежде чем передавать этот код как ваш собственный босс / клиент.

#!/usr/bin/perl

package My::Book;
use strict; use warnings;

use base 'Class::Accessor::Faster';

 __PACKAGE__->follow_best_practice;

__PACKAGE__->mk_accessors(qw(
    id author authorFirstName authorLastName title titleNo
    genre offer pub_date review reviewsratings
));

package My::Handler;
use strict; use warnings;

{{

my ($current_element, $element_data);

sub new { bless $_[1] => $_[0] }

sub start_element {
    my ($self, $data) = shift;
    my ($el) = @_;

    if ( (my $local_name = $el->{LocalName}) eq 'book' ) {
        my $book = My::Book->new({
            id => $el->{Attributes}{'{}id'}{Value}
        });
        push @$self, $book;
    }
    elsif ( $local_name ne 'books' ) {
        $current_element = $el->{LocalName};
    }
    return;
}

sub characters {
    my ($self, $data) = @_;
    if ( defined $current_element ) {
        $element_data .= $data->{Data};
    }
    return;
}

sub end_element {
    my ($self, $el) = @_;

    unless ( (my $local_name = $el->{LocalName}) =~ /\Abooks?\z/ ) {
        my $accessor = "set_$local_name";
        $self->[-1]->$accessor($element_data);
    }
    $current_element = undef;
    $element_data = '';
    return;
}


}}

package main;
use strict; use warnings;

use XML::SAX;

my @books;

my $parser = XML::SAX::ParserFactory->parser(
    { Handler => My::Handler->new(\@books) },
);

$parser->parse_file(\*DATA);

for my $book ( @books ) {
    printf("%s by %s was published on %s\n",
        $book->get_title, $book->get_author, $book->get_pub_date
    );
}


__DATA__
<?xml version="1.0" encoding="UTF-8"?>
<!--Sample XML file generated by XMLSpy v2009 sp1 (http://www.altova.com)-->
<bks:books xsi:schemaLocation="urn:books Untitled1.xsd"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:bks="urn:books">

<book id="String">
<author>String</author>
<authorFirstName>String</authorFirstName>
<authorLastName>String</authorLastName>
<title>String</title>
<titleNo>3</titleNo>
<genre>String</genre>
<offer>String</offer>
<pub_date>1967-08-13</pub_date>
<review>String</review>
<reviewsratings></reviewsratings>
</book>
</bks:books>

Выход:

C:\Temp> hui
String by String was published on 1967-08-13
...