我需要获取 HTML 元素内的所有内容,包括所有子节点和孙节点及其内容,就好像它是一个字符串一样。这是我的预期输出:
<div class="images"><div class="img_100"><a class="img a" legenda="" target="" style=""><img src="/img/site/570/b/random_image.jpg" alt="Lorem ipsum - dolor sit amet" class="portrait"></a></div></div>
我目前正在使用 JS 和 puppeteer 来抓取我需要的页面,但我需要所有 HTML 作为字符串来格式化一些内容,但我不知道如何以我想要的方式获得它。
我还使用此查询
document.querySelectorAll(".page_content_post")
来获取我想要的内容和子/孙节点的父元素。
提前致谢。
按班级获取家长:
document.getElementsByClassName('.page_content_post').innerHTML
通过 ID 获取父级:
document.getElementById('#page_content_post').innerHTML