尝试从计算机通过 Jupyter Notebook 访问使用 Dataproc,我使用 pip 安装了所需的库。但是,导入时出现错误
import google.cloud.dataproc_v1
错误如下:
ModuleNotFoundError Traceback (most recent call last)
<ipython-input-3-fc8862c62c75> in <module>
----> 1 import google.cloud.dataproc_v1
还尝试安装软件包 python3 -m pip install google-cloud-dataproc。作为参考,这里是 pip list 的输出。任何建议/帮助表示赞赏!
Package Version
------------------------ ---------
cachetools 4.1.1
certifi 2020.6.20
chardet 3.0.4
google-api-core 1.22.2
google-auth 1.21.1
google-cloud-dataproc 2.0.0
googleapis-common-protos 1.52.0
grpcio 1.32.0
idna 2.10
libcst 0.3.10
mypy-extensions 0.4.3
pip 20.2.2
proto-plus 1.9.1
protobuf 3.13.0
pyasn1 0.4.8
pyasn1-modules 0.2.8
pytz 2020.1
PyYAML 5.3.1
requests 2.24.0
rsa 4.6
setuptools 45.0.0
six 1.15.0
typing-extensions 3.7.4.3
typing-inspect 0.6.0
urllib3 1.25.10
wheel 0.35.1
您能否确认您正在从 Dataproc 上的 Jupyter 笔记本运行以及 Dataproc 的版本是什么?
我已使用 Dataproc 版本 1.5 在 Dataproc 笔记本上运行测试了以下代码
from google.cloud import dataproc_v1
from google.cloud import storage
project_id = 'project'
region = 'us-central1'
cluster_name = 'cluster'
cluster_client = dataproc_v1.ClusterControllerClient(
client_options={"api_endpoint": "{}-dataproc.googleapis.com:443".format(region)}
)
for cluster in cluster_client.list_clusters(request={"project_id": project_id, "region": region}):
cluster_name = cluster.cluster_name
print(f"{cluster_name}")
如果您从笔记本电脑内安装,请在单元中尝试此操作:
! pip 安装 google.cloud.dataproc_v1
如果由于缺少访问权限而出现错误,请尝试使用 --user 选项,即
! pip install google.cloud.dataproc_v1 --user
重新启动内核并尝试再次导入库。
试试这个:
pip install google-cloud-dataproc