虽然使用css选择器输出提取第一公司的名称是完美的,但是第二选择器“ sel2”返回None
from requests_html import HTMLSession
session = HTMLSession()
page=session.get("https://www.moneycontrol.com/stocks/marketstats/indcomp.php")
#print(page)
sel1 = '#mc_content > section > section > div.clearfix.stat_container > div.columnst.FR.wbg.brdwht > div > div.bsr_table.hist_tbl_hm.PR.Ohidden > table > tbody > tr:nth-child(1) > td.PR > span.gld13.disin'
sel2 = '#mc_content > section > section > div.clearfix.stat_container > div.columnst.FR.wbg.brdwht > div > div.bsr_table.hist_tbl_hm.PR.Ohidden > table > tbody > tr:nth-child(2) > td.PR > span.gld13.disin'
temp=page.html.find(sel1, first=True).text
print(temp.strip("\n Add to \n Watchlist | Portfolio"))
temp=page.html.find(sel2, first=True).text
print(temp.strip("\n Add to \n Watchlist | Portfolio"))
对于此特定页面,您可以使用更简单的选择器: