您可以使用 jQuery 通过迭代所有“
metadata
”类并提取您需要的内容来完成类似的事情:
//After including jQuery within your page
$(document).ready(function()
{
//Iterates through each of the metadata tags
$('.metadata').each(function()
{
//Pulls the username
var username = $('.yt-user-name', this).text();
//Pulls the link
var link = $('.time a', this).attr('href');
//Process each accordingly
alert(username + ':' + link);
});
});
如果你使用 jQuery,那就很简单了。但是,如果您在 bash 或 c/c++ 中执行此操作,则需要检索页面内容并解析您感兴趣的元素。您可以将元素视为 XML 并相当容易地解析属性。
您可以使用正则表达式,或与子字符串进行简单的文本匹配。
使用 awk(如果你擅长 bash),你可以逐行阅读页面并放置一个过滤器来捕获
<p class="metadata">
并开始复制,如果你面对 </p>
则结束复制
然后处理提取的部分,依此类推...