XPath从子元素中排除文本

问题描述 投票:2回答:2

我想得到输出:

 50ml milk

从以下代码:

<ul class="ingredients-list__group">
  <li>50ml <a href="/glossary/milk" class="tooltip-processed">milk
<div class="tooltip">
      <h2
        class="node-title">Milk</h2> <span class="fonetic">mill-k</span>
        <p>One of the most widely used ingredients, milk is often referred to as a complete food. While cow…</p>
        </div>
        </a>
  </li>
</ul>

目前我正在使用XPATH:

//ul[@class="ingredients-list__group"]/li

但得到:

50ml milk Milk mill-kOne of the most widely used ingredients, milk is often referred to as a complete food. While cow… 

如何排除div /工具提示中的内容?

xpath
2个回答
2
投票

使用xpath 2.0:

//ul[@class="ingredients-list__group"]/li/concat(./text()[1], ./a/text()[1])

使用xpath 1.0:

concat(//ul[@class="ingredients-list__group"]/li/text()[1], //ul[@class="ingredients-list__group"]/li/a/text()[1])'

0
投票

您可以使用选择相关的文本节点

//ul[@class="ingredients-list__group"]//
   text()[not(ancestor::div[@class='tooltip'])]

如果您使用的是XPath 2.0,则可以将其置于string-join()调用中,将它们连接成一个字符串。如果您坚持使用1.0,则必须将多个文本节点返回到调用应用程序,并将它们连接在一起,并使用主机语言代码。

© www.soinside.com 2019 - 2024. All rights reserved.