Apache Zeppelin是一款基于Web的笔记本电脑,支持数据驱动的交互式数据分析。您可以使用SQL,Python,Scala等制作精美的数据驱动,交互式和协作文档。它还支持Markdown语法。
我已经设置了 Zeppeline Docker 实例并在远程 VM 中运行。 此外,我使用下面的示例 Shiro.ini 启用了 Shiro 身份验证 [用户] admin = 管理员,管理员 用户 1 = 用户 1、角色 1、角色 2 ...
我已经部署了一个有 2 个节点的 zeepline 集群。配置“zeppelin.cluster.addr”,notebook和interpreter存放在hdfs中,使用nginx做负载均衡。在使用中,我发现
我在 Docker 上使用 Apache Zeppelin 0.10.1 和 Spark 3.3.0,我一直收到这个错误... com.fasterxml.jackson.databind.JsonMappingException:Scala 模块 2.13.3 需要 Jackson Databind versi ...
我通过Zeppelin使用Spark 2.2.1。现在我的spark读取代码如下: val data = spark.read.option("header", "true").option("delimiter", ",").option("treatEmptyValuesAsNulls", "true")......。
我想在zeppelin中用%network可视化我的图。我已经通过读取JSON文件定义了节点和边缘。 val nodes = spark.read.option("multiline", "true").json("optnodes.json") val edges = ....
在Zeppelin中使用%pyspark解释器注册表时,我无法访问%sql中的表。
我使用的是Zeppelin 0.5.5。我在这里找到了这个python的代码示例,因为我无法让我自己的代码与%pyspark http:/www.makedatauseful.compython-spark-sql-zeppelin-tutorial。我有一种感觉...
在Apache Zeppelin中使用z.run()来触发一个段落。
我在使用Apache Zeppelin时遇到了一些问题,我不知道我遗漏了什么,基本上我是想在Apache Zeppelin中使用z.run从另一个段落中触发一个段落。当我在Apache Zeppelin上运行...
我正在使用zeppelin和spark,我想从S3中获取一个2TB的文件,并在Spark中对其进行变换,然后将其上传到S3,这样我就可以在Jupyter笔记本中使用该文件。这个...
我有一个spark.sql对象,其中包括几个变量。 import com.github.nscala_time.time.Imports.LocalDate val first_date = new LocalDate(2020, 4, 1) val second_date = new LocalDate(2020, 4, ...)
我有Zeppelin在Hadoop之上,有一个Spark集群。我想在一个笔记中运行前五段,然后在另一个笔记中运行前五段。我不想让它们在同一时间运行 ...
我在一个共享的Apache Zeppelin服务器上工作。几乎每天,我都会尝试运行一个命令,并得到这个错误。Job 65 cancelled because SparkContext was shut down 我很想知道更多关于... I would love to learn more about what...
如何让Apache ZeppelinShiro在不同的端口(不是8080)上工作?
Apache Zeppelin 0.9.0 preview1包括基本的Shiro auth,只要在confzeppelin-site.xml中指定的zeppelin.server.port是8080,就可以正常工作。然而,我想使用另一个端口(例如9000)来进行 ...
我在Spark集群上使用Zeppelin与Hadoop。我想检查一个段落的状态,看看它是成功、运行、不运行还是错误。我知道我可以滚动到段落,然后......
我在Spark集群上使用Zeppelin与Hadoop。我想定义变量,然后清除它们。 val myvar = 1 我想能够myvar,并让它不再等于1。
我在Spark集群上使用Zeppelin与Hadoop。我想运行一个命令来检查s3上的文件,我想使用一个变量。这是我的代码 %sh aws s3 ls s3:/my-bucketmy_folder 我可以 ...
如何使用angular脚本在WHERE子句的查询界面的下拉菜单中添加额外的功能,如操作符,条件子句?
我试图添加一些额外的功能,就像在superset中一样,比如在WHERE子句中有一个下拉菜单,其中提到了几个操作,如EQUAL TO,NOT EQUAL TO,GREATER THAN等。
为什么火花中的一些音符工作得很慢,为什么在同一情况下多次执行的时间不同?
我的问题是关于pyspark代码在zeppelin中的执行时间。我有一些笔记,我在其中使用了一些SQL,在我的一个笔记中,我用.topandas()函数将我的数据框架转换为panda......。
我正在用Apache齐柏林飞艇和hadoop运行Spark。我的理解是Zeppelin就像一个kube应用程序,它将命令发送到运行Spark并使用Hadoop访问文件的远程计算机。我...
这个问题可能是这个问题的重复,但给出的答案并不令人满意。我在Zeppelin上运行了以下简单代码:(与pyspark CLI相同的情况)%spark2 ....