所以这是我的代码,我正在努力工作
import requests
from bs4 import BeautifulSoup
url = 'https://digitalcoinprice.com'
source_code = requests.get(url)
plain_text = source_code.text
soup = BeautifulSoup(plain_text, "html.parser")
for link in soup.find_all('a', {'class': 'coin_currency_name'}):
title = link.string
print(title)
我的最终目标是创建一个网络爬虫,每5分钟记录前100个加密货币的信息。我想解决这个问题,但我正在努力克服这个障碍。我跑的时候
python wcrawl.py
所有这一切都是移动到我可以输入新命令的地方....抱歉,我对这个主题的知识不足以提供更多细节,我现在已经整整使用了12个小时的python。
更多信息:
Windows 10内置Anaconda CMD Prompt Python 3.7.2
你应该找到'span'标签而不是'a'标签。
import requests
from bs4 import BeautifulSoup
url = 'https://digitalcoinprice.com'
source_code = requests.get(url)
plain_text = source_code.text
soup = BeautifulSoup(plain_text, "html.parser")
for link in soup.find_all('span', {'class': 'coin_currency_name'}):
title = link.string
print(title)
你可以使用pandas和read_html
import pandas as pd
tables = pd.read_html('https://digitalcoinprice.com/')
print(tables[0])
如果做很多考虑也考虑使用API method