从Beautifulsoup4获取字符串的问题

问题描述 投票:1回答:2

所以这是我的代码,我正在努力工作

import requests 
from bs4 import BeautifulSoup


url = 'https://digitalcoinprice.com'
source_code = requests.get(url)
plain_text = source_code.text
soup = BeautifulSoup(plain_text, "html.parser")
for link in soup.find_all('a', {'class': 'coin_currency_name'}):
    title = link.string
    print(title)

我的最终目标是创建一个网络爬虫,每5分钟记录前100个加密货币的信息。我想解决这个问题,但我正在努力克服这个障碍。我跑的时候

python wcrawl.py

所有这一切都是移动到我可以输入新命令的地方....抱歉,我对这个主题的知识不足以提供更多细节,我现在已经整整使用了12个小时的python。

更多信息:

Windows 10内置Anaconda CMD Prompt Python 3.7.2

python web-scraping beautifulsoup anaconda
2个回答
0
投票

你应该找到'span'标签而不是'a'标签。

import requests 
from bs4 import BeautifulSoup

url = 'https://digitalcoinprice.com'
source_code = requests.get(url)
plain_text = source_code.text 
soup = BeautifulSoup(plain_text, "html.parser")
for link in soup.find_all('span', {'class': 'coin_currency_name'}):
    title = link.string
    print(title)

0
投票

你可以使用pandas和read_html

import pandas as pd
tables = pd.read_html('https://digitalcoinprice.com/')
print(tables[0])

如果做很多考虑也考虑使用API method

© www.soinside.com 2019 - 2024. All rights reserved.