从元内容中提取文本

问题描述 投票:0回答:1

假设我们有以下网站:第比利斯房屋价格

有我已经实现的代码片段及其相应的结果:

div_class =content.find_all("div",class_='sc-8fa2c16a-5 gpNUxi')
for  div in div_class:
    prices.append(div.text)
    subcontent =requests.get(base_link+div.a['href'])
    subcontent =BeautifulSoup(subcontent.text,'html.parser')
    meta=subcontent.find_all("meta",property='og:description')
    print(meta[0])

返回的结果是:

<meta content="იყიდება 4 ოთახიანი ბინა. თეთრი კარკასი. ორი სველი წერტილი. (ერთი სველი წერტილი გარემონტებულია) დიდი ტერასითა და მოწესრიგებული სადარბაზოთი. დახურული ეზო შლაგბაუმით. ვარ მესაკუთრე. მეტროდან 
მაქსიმუმ 5 წუთის სავალზე.
სველი წერტილები ისეა განლაგებული შესაძლებელია მარტივატ ორ ბინად დაყოფა. 

ფასზე დალაპარაკება შესაძლებელია.
01.11.12.018.202

" property="og:description"/>

如何从中提取文本? 我已经尝试过meta[0].text,但它还没有显示结果,请问有什么建议吗?

python web-scraping beautifulsoup
1个回答
0
投票

试试这个

meta[0].attrs["content"]
© www.soinside.com 2019 - 2024. All rights reserved.