作为示例,我想从下一页中提取团队名称
http://www.scoresandodds.com/grid_20150409.html
我尝试过:
from lxml import html
import requests
pageNBA = requests.get('http://www.scoresandodds.com/grid_20150409.html')
treeNBA = html.fromstring(pageNBA.text)
team = treeNBA.xpath('//a[@href="/statfeed/statfeed.php?page=nba/nbateam&teamid=CHICAGO&season="]/text()')
我认为我的问题出在我定义位置的团队行中,我应该如何找到 href。
您可以按如下方式使用xpath:
//td[@class='name']/a