如何使用python使用javascript从网页中获取表格内容?

问题描述 投票:0回答:1

我喜欢从这个page中获取表格内容。以下是我的代码,我得到了NaN(没有数据)。为什么这些数字没有出现?如何使用相应的数据获取表格?谢谢。

enter image description here

javascript python selenium-webdriver web-scraping
1个回答
1
投票

你可以从api获得一个不错的json格式:

import requests
import pandas as pd

url = 'https://api.blockchain.info/stats'

headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
params = {'cors': 'true'}

data = requests.get(url, headers=headers, params=params).json()

# if you want it as a table
df = pd.DataFrame(data.items())

选项2:

让页面完全呈现。有一个更好的方法来使用qazxsw poi和Selenium,但是很快就在那里等了5秒钟来表明:

wait

输出:

from selenium import webdriver
import pandas as pd
import time

url = 'https://www.blockchain.com/stats'


browser = webdriver.Chrome('C:/chromedriver_win32/chromedriver.exe')
browser.get(url)
time.sleep(5)

dfs = pd.read_html(browser.page_source)
print(dfs[0])

browser.close()
© www.soinside.com 2019 - 2024. All rights reserved.