当用户输入任何单词时,我试图从 www.thesaurus.com 中抓取所有同义词(见图)。
我已经成功获取了“名词”和“含义”等信息,但是当涉及到尝试获取同义词时,我遇到了一个问题,因为
的每个“值”BeautifulSoup .find_all('a', attrs={'href':'**my problem**'})
自从 href = "/browse/**each different synonym**"
以来,将会有所不同。
通过CSS选择器更容易
.select()
,见下文
import requests
from bs4 import BeautifulSoup
response = requests.get("https://www.thesaurus.com/browse/power")
soup = BeautifulSoup(response.content, 'html.parser')
# select only first '<section class="synonyms-container....'
synonyms = soup.select('.MainContentContainer > section > .synonyms-container a')
print 'synonyms for: Power'
for synonym in synonyms:
print synonym.text
#print synonym.get('href')