如何显示/查看`sklearn.utils.Bunch`数据集?

问题描述 投票:0回答:3

我正在学习使用

sklearn.utils.Bunch
作为数据集的教程:

cal_housing = fetch_california_housing()

我在 Databricks 笔记本上运行它。

我已经阅读了我能找到的文档,例如 https://scikit-learn.org/stable/modules/ generated/sklearn.utils.Bunch.html并且搜索引擎没有产生任何有用的东西。

但是我如何查看/查看此数据集中的内容?

python scikit-learn databricks
3个回答
8
投票

如果我理解正确,你可以将其转换为 pandas 数据框:

df = california_housing.fetch_california_housing()
calf_hous_df = pd.DataFrame(data= df.data, columns=df.feature_names)    
calf_hous_df.sample(4)

enter image description here

此外,你还可以看到属性:

df.keys()
dict_keys(['data', 'target', 'feature_names', 'DESCR'])

0
投票

sklearn.utils.Bunch
数据可以通过使用
pandas
将其放入数据框来查看:

data = pd.DataFrame(cal_housing.data,columns=cal_housing.feature_names)
data

0
投票

您可以使用items()和keys()方法读取数据,作为sklearn.utils.Bunch中的引用。 但是Pandas Dataframe中没有类似head()的方法。

dataset.items()
将显示所有数据。

我尝试使用 iris 数据集如下。

import sklearn
from sklearn import datasets

# load iris dataset
iris = datasets.load_iris()
print(type(iris))
iris.items()
iris.keys()
iris.get('feature_names')
© www.soinside.com 2019 - 2024. All rights reserved.