ASP.net:抓取部分网页

问题描述 投票:0回答:1
     Dim url As New Uri("http://www.testpage.com")
    If url.Scheme = Uri.UriSchemeHttp Then
        'Create Request Object
        Dim objRequest As HttpWebRequest = DirectCast(HttpWebRequest.Create(url), HttpWebRequest)
        'Set Request Method
        objRequest.Method = WebRequestMethods.Http.[Get]
        'Get response from requested url
        Dim objResponse As HttpWebResponse = DirectCast(objRequest.GetResponse(), HttpWebResponse)
        'Read response in stream reader
        Dim reader As New StreamReader(objResponse.GetResponseStream())
        Dim tmp As String = reader.ReadToEnd()
        objResponse.Close()
        'Set response data to container
        Label1.Text = tmp
    End If

我如何只抓取网页的一部分。代码成功获取完整的html内容。

例如..我想刮掉

<div id="content"> </div>

之间的所有内容
asp.net web-scraping
1个回答
1
投票

将页面的完整 html 内容存储在字符串变量中后,您可以在此字符串上使用正则表达式来返回要提取的部分。

由于您没有提供有关要提取的内容的详细信息,我将为您提供有关如何使用正则表达式的链接。

有关正则表达式的简短教程可以在这里

找到
© www.soinside.com 2019 - 2024. All rights reserved.