从 html 页面提取元素

Question

Answer 1

您可以使用 jQuery 通过迭代所有“

metadata

”类并提取您需要的内容来完成类似的事情：

//After including jQuery within your page
$(document).ready(function()
{
    //Iterates through each of the metadata tags
    $('.metadata').each(function()
    {
          //Pulls the username
          var username = $('.yt-user-name', this).text();
          //Pulls the link
          var link = $('.time a', this).attr('href');
          //Process each accordingly
          alert(username + ':' + link);
    });
});

工作示例

Answer 2

如果你使用 jQuery，那就很简单了。但是，如果您在 bash 或 c/c++ 中执行此操作，则需要检索页面内容并解析您感兴趣的元素。您可以将元素视为 XML 并相当容易地解析属性。

您可以使用正则表达式，或与子字符串进行简单的文本匹配。

Answer 3

使用 awk（如果你擅长 bash），你可以逐行阅读页面并放置一个过滤器来捕获

<p class="metadata">

并开始复制，如果你面对

</p>

则结束复制

然后处理提取的部分，依此类推...

从 html 页面提取元素

问题描述投票：0回答：3

3个回答

最新问题

从 html 页面提取元素

问题描述 投票：0回答：3

3个回答

最新问题

问题描述投票：0回答：3