apache-zeppelin 相关问题

Apache Zeppelin是一款基于Web的笔记本电脑,支持数据驱动的交互式数据分析。您可以使用SQL,Python,Scala等制作精美的数据驱动,交互式和协作文档。它还支持Markdown语法。

使用zeppelin,scala和EMR在spark中配置调度池

在pyspark中,我可以通过执行以下操作在zeppelin(在AWS EMR上)中更改为公平的调度程序:conf = sc.getConf()conf.set('spark.scheduler.allocation.file','/ etc / spark /conf.dist / ...

回答 1 投票 2

Zeppelin的Google代码格式化程序导致未更改代码中的格式更改

我已经下载了标签0.8.1的Zeppelin,并按照贡献指南中的说明,我尝试使用google formatter for intellij以及eclipse formatter通过以下链接:https://github.com / ...

回答 1 投票 0

为什么火花工作在使用pyspark shell时在zeppelin工作时不起作用

我试图在zepplin df = spark.read.csv('/ path / to / csv')df.show(3)上执行以下代码但是我得到以下错误Py4JJavaError:调用o786时发生错误.. ..

回答 2 投票 0

Zeppelin通过REST API执行带有参数的作业(所有段落)

我有一个有许多段落的齐柏林飞艇。我有一个段落应该接收/设置一些参数,这些参数将被其他段落进一步使用。我想通过...提交工作

回答 2 投票 0

如何在Zubernetes中将Zeppelin连接到Spark Master

我在Kubernetes上安装了Spark和Zeppeline使用helm chart孵化器/ Spark在Zeppeline解释器中,Spark的master设置为local [*]然后,我改为spark:// ClusterIP_Spark_Master:...

回答 1 投票 2

Apache Zeppelin - zeppelin.cmd没有显示结果

我在Windows 10上的0.81 Apache Zeppelin上解压缩了完整版本。我导航到C:\ Zeppelin \ bin并输入zeppelin.cmd之后我没有得到任何输出C:\ Zeppelin \ bin“只是得到...

回答 1 投票 3

许多流媒体源的检查点

我正在使用zeppelin,我从火花流中读取了许多来源的文件:val var1 = spark .readStream .schema(var1_raw).option(“sep”,“,”)。option(“mode”,“.. 。

回答 1 投票 0

使用Apache Zeppelin使用-deprecation重新运行Scala代码

我正在使用Zeppelin笔记本在Scala中创建Spark脚本。代码:def测试:DataFrame = {// code}我收到以下警告:警告:有一个弃用警告;回覆-...

回答 1 投票 4

Shiro配置 - 角色和限制搜索库

我们一直在尝试添加正确的shiro配置,以确保特定的AD组只能登录,并且还可以区分角色。我们有两个工作解决方案,但第一个让每个人都有...

回答 1 投票 2

在Amazon EMR中执行Zeppelin笔记本作为重复工作

我正在从Databricks迁移到Amazon EMR,并计划使用Zeppelin笔记本代替Databricks笔记本。目前,许多Databricks笔记本计划作为工作。有没有 ...

回答 1 投票 0

如何使用REST api运行zeppelin笔记本并在python中返回结果?

我使用python的以下REST调用运行zeppelin笔记本:import requests requests.post('http:// xyzx:8080 / api / notebook / job / 2BZ3VJZ4G')。json()输出为{u'status' :你好'} ......

回答 3 投票 1

使用AWS Glue Jobs将缺少的列值设置为默认值

我正在尝试使用Glue从dynamodb提取数据集到s3。在此过程中,我想选择少量列,然后为具有缺失值的任何和所有行/列设置默认值。 ...

回答 1 投票 0

在vmware上安装Zeppelin和spark

我在VMware工作站上安装了zeppelin和spark(centos 7)。我安装java添加java home添加spark home到zeppelin我不想从localhost地址启动zeppelin但是从ip ...

回答 1 投票 0

Spark + Zeppelin中没有添加依赖项

我无法从zeppelin向spark类路径添加自定义依赖项。环境:AWS EMR:Zeppelin 0.8.0,Spark 2.4.0额外配置火花解释器:spark.jars.ivySettings / tmp / ivy-settings ....

回答 1 投票 0

AZURE HD INSIGHT(群集)将CSV文件导入存储:创建表格

我对编码非常陌生 - 我知道基础知识,所以我在这个项目上拔头发。我试图最终将我的Hadoop集群链接到Tableau,我的项目的大部分将...

回答 1 投票 0

Spark写csv通过zeppelin失败

Spark 2.1.1.2.6.2.0-205 Zeppelin 0.7.3我在某台机器上运行一段代码,比如服务器-A。代码完成得很好。当我通过Zeppelin运行相同的代码(连接到相同的...

回答 1 投票 1

在Zeppelin可视化中更改默认组颜色

我有一堆数据,我正在放入散点图,但默认的颜色排序是“蓝色”,“浅蓝色”,然后最后是“橙色”。我的数据分为两组,具有常数组名,......

回答 1 投票 1

apache-zeppelin在mac OS上使用home brew时安装0.8.0

我已经安装了java版“1.8.0_181”,scala,apache-spark,apache-zeppelin使用home brew,并且在这些安装时没有出现错误。如果我在终端上运行$ spark-shell,...

回答 2 投票 0

如何让Zeppelin在EMR集群上干净地重启?

我正在运行EMR集群并尝试使用Zeppelin笔记本进行数据分析。版本:发行标签:emr-5.2.1 Hadoop发行版:Amazon 2.7.3 Hive 2.1.0 Spark 2.0.2 Zeppelin 0.6.2我...

回答 4 投票 8

使用%pyspark中的Dataframe到zeppelin中的%python

我在%pyspark中有一个pandas数据帧,我想在zeppelin中的%python单元格中使用它。我无法做到。知道如何做到这一点?

回答 1 投票 -2

© www.soinside.com 2019 - 2024. All rights reserved.