在<h2><div>内刮

问题描述 投票:0回答:2

只是在刮擦此代码上的

h2
时遇到一些麻烦:

<div id="content">
    <div class="title-wrapper">
        <article class="article">
        <figure>
            <a title="Ölüm Denizi" href="http://trfilmizle.com/olum-denizi.html">
                <img class="small-poster" alt="Ölüm Denizi" src="http://i706.photobucket.com/albums/ww64/ddizi/TRfilmizle/OumlluumlmDenizi_zpsc809f300.jpg~original">
            </a>
        </figure>
    <div class="article-container">
    <h2>
        <a title="Ölüm Denizi" href="http://trfilmizle.com/olum-denizi.html">Ölüm Denizi</a>
    </h2>
    <div class="article-info">
    <div class="description"> Kuzey Kore, Güney Kore ve Çin arasına sıkışmış Yanji kentinde geçen Ölüm Denizi, araba kovalamacaları, cinayetler ve bıçaklı kavgalarla dolu… </div>
</div>

有什么想法吗?我可以通过以下方式访问节点:

//article[@class='article']/text()

但是,拿不到

h2
!有什么建议吗?

php html web-scraping xpath
2个回答
0
投票

这应该获取

h2
s:
div

元素下方的所有文本组件
//div/h2//*/text()

更具体地说,您可以将其限制为特定的

div

//div[@class='article-container']/h2//*/text()

0
投票
© www.soinside.com 2019 - 2024. All rights reserved.