获取div内所有内容作为字符串

问题描述 投票:0回答:1

我需要获取 HTML 元素内的所有内容,包括所有子节点和孙节点及其内容,就好像它是一个字符串一样。这是我的预期输出:

<div class="images"><div class="img_100"><a class="img a" legenda="" target="" style=""><img src="/img/site/570/b/random_image.jpg" alt="Lorem ipsum - dolor sit amet" class="portrait"></a></div></div>

我目前正在使用 JS 和 puppeteer 来抓取我需要的页面,但我需要所有 HTML 作为字符串来格式化一些内容,但我不知道如何以我想要的方式获得它。

我还使用此查询

document.querySelectorAll(".page_content_post")
来获取我想要的内容和子/孙节点的父元素。

提前致谢。

javascript html web-scraping selector
1个回答
1
投票

按班级获取家长:

document.getElementsByClassName('.page_content_post').innerHTML

通过 ID 获取父级:

document.getElementById('#page_content_post').innerHTML
© www.soinside.com 2019 - 2024. All rights reserved.