我试图在XML文件中找到所有标记(包括其XPATH),该文件放在oracle表的CLOB列中。你能否提供一个查询。
可以使用XSL样式表生成唯一标记的列表。
首先使用随机sample XML创建一个XML存储为CLOB的简单表:
create table sample_xml(id number, some_xml clob);
insert into sample_xml values(1, q'[<?xml version="1.0"?>
<catalog>
<book id="bk101">
<author>Gambardella, Matthew</author>
<title>XML Developer's Guide</title>
</book>
<book id="bk102">
<author>Ralls, Kim</author>
<title>Midnight Rain</title>
</book>
</catalog>]');
现在使用XMLTRANSFORM
将XML转换为一组不同的标签,使用this question的XML样式表:
select xmltransform(
xmltype(some_xml),
xmltype('<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
xmlns:xs="http://www.w3.org/2001/XMLSchema"
exclude-result-prefixes="xs"
version="2.0">
<xsl:output method="text"/>
<xsl:strip-space elements="*" />
<xsl:key name="kElemByName" match="*" use="name(.)"/>
<xsl:template match="
*[generate-id()
=
generate-id(key(''kElemByName'', name(.))[1])
]">
<xsl:value-of select="concat(name(.), '''||chr(38)||'#xA;'')"/>
<xsl:apply-templates select="*"/>
</xsl:template>
<xsl:template match="text()"/>
</xsl:stylesheet>')) tags
from sample_xml;
TAGS
----
catalog
book
author
title
您可以使用regexp_substr
分割字符串,一次一行地得到结果:
select regexp_substr(replace(tags, chr(10), ','),'[^,]+', 1, level) from
(
... insert large query here
)
connect by regexp_substr(replace(tags, chr(10), ','),'[^,]+', 1, level) is not null;
要查看属性,请查看链接的问题,它还包括用于获取属性的XML样式表。