如何在使用 XML::Simple 读取 XML 文件时保持其值的顺序?

问题描述 投票:0回答:2

我正在使用 XML::Simple 来解析 XML 文件。下面给出了带有 XML 文件的代码,

use Tie::IxHash;

tie %$data, "Tie::IxHash";

use XML::Simple;
use Data::Dumper;

$xml = new XML::Simple;
$data = $xml->XMLin("ship_order.xml");
print Dumper($data);

XML 文件,(ship_order.xml)

<?xml version="1.0" encoding="UTF-8" ?> 

<shipment>
    <shiptoaddress>
        <name>Prasad</name> 
        <address>AnnaNagar</address> 
    </shiptoaddress> 
    <items>
        <quantity>5</quantity> 
        <price>100</price> 
    </items> 
    <items>
        <quantity>6</quantity> 
        <price>50</price> 
    </items>
    <num_of_items>2</num_of_items>
</shipment>

即使我使用 Tie::IxHash 模块,输出也没有按顺序出现。

我的输出:

$VAR1 = {
          'num_of_items' => '2',
          'shiptoaddress' => {
                             'name' => 'Prasad',
                             'address' => 'AnnaNagar'
                           },
          'items' => [
                     {
                       'quantity' => '5',
                       'price' => '100'
                     },
                     {
                       'quantity' => '6',
                       'price' => '50'
                     }
                   ]
        };
xml perl hash
2个回答
6
投票

啊,但你没有使用

Tie::IxHash
。 或者更准确地说,你开始使用
Tie::IxHash
然后销毁它:

$data = $xml->XMLin("ship_order.xml");

此行丢弃您创建的哈希引用,并将方法调用中的一个分配给

$data

如果您关心项目的顺序(您可能不必这样做,因为任何合适的 XML 格式都会包含一个告诉您顺序的属性),您将需要使用返回对象而不是数据的解析器结构。 该对象将知道查看项目的顺序,并为您提供返回它们的

children
方法。

或者,您可以自己构建数据结构:

#!/usr/bin/perl

use strict;
use warnings;

use XML::Twig;

my $shipment;
my $t = XML::Twig->new(
    twig_handlers => {
        shiptoaddress => sub {
            my ($t, $elt) = @_;

            $shipment->{name}    = $elt->first_child("name")->text;
            $shipment->{address} = $elt->first_child("address")->text;

            $t->purge;
        },
        items => sub {
            my ($t, $elt) = @_;

            push @{$shipment->{items}}, {
                quantity => $elt->first_child("quantity")->text,
                price    => $elt->first_child("price")->text,
            };

            $t->purge;
        },
    },
);

$t->parse(join "", <DATA>); #FIXME: use parsefile later

use Data::Dumper;
print Dumper $shipment;

__DATA__
<?xml version="1.0" encoding="UTF-8" ?> 

<shipment>
    <shiptoaddress>
        <name>Prasad</name> 
        <address>AnnaNagar</address> 
    </shiptoaddress> 
    <items>
        <quantity>5</quantity> 
        <price>100</price> 
    </items> 
    <items>
        <quantity>6</quantity> 
        <price>50</price> 
    </items>
    <num_of_items>2</num_of_items>
</shipment>

3
投票

您可以考虑对

XML::Simple
进行子类化,并使用
Tie::IxHash
重写创建哈希的必要方法。

但是,请认真考虑

XML::Simple
的作者在CPAN论坛上在此线程中给出的答案:如何保留XML::简单元素顺序...

保留元素顺序现在不是、也永远不会是 XML::Simple 的一个功能。对于某些 XML 文档类型,您可以通过子类化 XML::Simple 并重写 new_hashref() 方法来提供与 Tie::IxHash 关联的 hashref 来破解它。这可以解决 ABC 案,但无法解决 ABA 案。 简而言之,如果您关心元素顺序,那么您不应该使用 XML::Simple。 XML::LibXML 是一个很好的替代方案,对于许多用例而言,它实际上并不比 XML::Simple 更难使用 - 如 [1]

中所述

还有他在代码中输入的内容:

    ##############################################################################
    # Method: new_hashref()
    #
    # This is a hook routine for overriding in a sub-class.  Some people believe
    # that using Tie::IxHash here will solve order-loss problems.
    # 

    sub new_hashref {
      my $self = shift;
    
      return { @_ };
    }

[1] - 从 XML::Simple 升级到 XML::LibXML

© www.soinside.com 2019 - 2024. All rights reserved.