Apache Zeppelin是一款基于Web的笔记本电脑,支持数据驱动的交互式数据分析。您可以使用SQL,Python,Scala等制作精美的数据驱动,交互式和协作文档。它还支持Markdown语法。
使用zeppelin,scala和EMR在spark中配置调度池
在pyspark中,我可以通过执行以下操作在zeppelin(在AWS EMR上)中更改为公平的调度程序:conf = sc.getConf()conf.set('spark.scheduler.allocation.file','/ etc / spark /conf.dist / ...
Zeppelin的Google代码格式化程序导致未更改代码中的格式更改
我已经下载了标签0.8.1的Zeppelin,并按照贡献指南中的说明,我尝试使用google formatter for intellij以及eclipse formatter通过以下链接:https://github.com / ...
为什么火花工作在使用pyspark shell时在zeppelin工作时不起作用
我试图在zepplin df = spark.read.csv('/ path / to / csv')df.show(3)上执行以下代码但是我得到以下错误Py4JJavaError:调用o786时发生错误.. ..
Zeppelin通过REST API执行带有参数的作业(所有段落)
我有一个有许多段落的齐柏林飞艇。我有一个段落应该接收/设置一些参数,这些参数将被其他段落进一步使用。我想通过...提交工作
如何在Zubernetes中将Zeppelin连接到Spark Master
我在Kubernetes上安装了Spark和Zeppeline使用helm chart孵化器/ Spark在Zeppeline解释器中,Spark的master设置为local [*]然后,我改为spark:// ClusterIP_Spark_Master:...
Apache Zeppelin - zeppelin.cmd没有显示结果
我在Windows 10上的0.81 Apache Zeppelin上解压缩了完整版本。我导航到C:\ Zeppelin \ bin并输入zeppelin.cmd之后我没有得到任何输出C:\ Zeppelin \ bin“只是得到...
我正在使用zeppelin,我从火花流中读取了许多来源的文件:val var1 = spark .readStream .schema(var1_raw).option(“sep”,“,”)。option(“mode”,“.. 。
使用Apache Zeppelin使用-deprecation重新运行Scala代码
我正在使用Zeppelin笔记本在Scala中创建Spark脚本。代码:def测试:DataFrame = {// code}我收到以下警告:警告:有一个弃用警告;回覆-...
我们一直在尝试添加正确的shiro配置,以确保特定的AD组只能登录,并且还可以区分角色。我们有两个工作解决方案,但第一个让每个人都有...
在Amazon EMR中执行Zeppelin笔记本作为重复工作
我正在从Databricks迁移到Amazon EMR,并计划使用Zeppelin笔记本代替Databricks笔记本。目前,许多Databricks笔记本计划作为工作。有没有 ...
如何使用REST api运行zeppelin笔记本并在python中返回结果?
我使用python的以下REST调用运行zeppelin笔记本:import requests requests.post('http:// xyzx:8080 / api / notebook / job / 2BZ3VJZ4G')。json()输出为{u'status' :你好'} ......
我正在尝试使用Glue从dynamodb提取数据集到s3。在此过程中,我想选择少量列,然后为具有缺失值的任何和所有行/列设置默认值。 ...
我在VMware工作站上安装了zeppelin和spark(centos 7)。我安装java添加java home添加spark home到zeppelin我不想从localhost地址启动zeppelin但是从ip ...
我无法从zeppelin向spark类路径添加自定义依赖项。环境:AWS EMR:Zeppelin 0.8.0,Spark 2.4.0额外配置火花解释器:spark.jars.ivySettings / tmp / ivy-settings ....
AZURE HD INSIGHT(群集)将CSV文件导入存储:创建表格
我对编码非常陌生 - 我知道基础知识,所以我在这个项目上拔头发。我试图最终将我的Hadoop集群链接到Tableau,我的项目的大部分将...
Spark 2.1.1.2.6.2.0-205 Zeppelin 0.7.3我在某台机器上运行一段代码,比如服务器-A。代码完成得很好。当我通过Zeppelin运行相同的代码(连接到相同的...
我有一堆数据,我正在放入散点图,但默认的颜色排序是“蓝色”,“浅蓝色”,然后最后是“橙色”。我的数据分为两组,具有常数组名,......
apache-zeppelin在mac OS上使用home brew时安装0.8.0
我已经安装了java版“1.8.0_181”,scala,apache-spark,apache-zeppelin使用home brew,并且在这些安装时没有出现错误。如果我在终端上运行$ spark-shell,...
我正在运行EMR集群并尝试使用Zeppelin笔记本进行数据分析。版本:发行标签:emr-5.2.1 Hadoop发行版:Amazon 2.7.3 Hive 2.1.0 Spark 2.0.2 Zeppelin 0.6.2我...
使用%pyspark中的Dataframe到zeppelin中的%python
我在%pyspark中有一个pandas数据帧,我想在zeppelin中的%python单元格中使用它。我无法做到。知道如何做到这一点?