apache-zeppelin 相关问题

Apache Zeppelin是一款基于Web的笔记本电脑,支持数据驱动的交互式数据分析。您可以使用SQL,Python,Scala等制作精美的数据驱动,交互式和协作文档。它还支持Markdown语法。

zeppelin spark.pyspark 解释器错误:AttributeError: 'SparkSession' object has no attribute '_wrapped'

使用 %spark.pyspark 解释器时,出现错误: org.apache.zeppelin.interpreter.InterpreterException:org.apache.zeppelin.interpreter.InterpreterException:无法引导 pyspark 在组织。

回答 1 投票 0

使用 Shiro 登录 Zeppeline 失败

我已经设置了 Zeppeline Docker 实例并在远程 VM 中运行。 此外,我使用下面的示例 Shiro.ini 启用了 Shiro 身份验证 [用户] admin = 管理员,管理员 用户 1 = 用户 1、角色 1、角色 2 ...

回答 0 投票 0

apache zeppelin 多节点集群

我已经部署了一个有 2 个节点的 zeepline 集群。配置“zeppelin.cluster.addr”,notebook和interpreter存放在hdfs中,使用nginx做负载均衡。在使用中,我发现

回答 0 投票 0

Apache Zeppelin 和 Spark 显示 Scala 模块 2.13.3 需要 Jackson Databind 版本 >= 2.13.0 和 < 2.14.0 - Found jackson-databind version 2.12.0

我在 Docker 上使用 Apache Zeppelin 0.10.1 和 Spark 3.3.0,我一直收到这个错误... com.fasterxml.jackson.databind.JsonMappingException:Scala 模块 2.13.3 需要 Jackson Databind versi ...

回答 1 投票 0

Spark CSV读取 忽略字符

我通过Zeppelin使用Spark 2.2.1。现在我的spark读取代码如下: val data = spark.read.option("header", "true").option("delimiter", ",").option("treatEmptyValuesAsNulls", "true")......。

回答 1 投票 0

如何在zeppelin中用网络可视化图形?

我想在zeppelin中用%network可视化我的图。我已经通过读取JSON文件定义了节点和边缘。 val nodes = spark.read.option("multiline", "true").json("optnodes.json") val edges = ....

回答 1 投票 0

在Zeppelin中使用%pyspark解释器注册表时,我无法访问%sql中的表。

我使用的是Zeppelin 0.5.5。我在这里找到了这个python的代码示例,因为我无法让我自己的代码与%pyspark http:/www.makedatauseful.compython-spark-sql-zeppelin-tutorial。我有一种感觉...

回答 2 投票 5

在Apache Zeppelin中使用z.run()来触发一个段落。

我在使用Apache Zeppelin时遇到了一些问题,我不知道我遗漏了什么,基本上我是想在Apache Zeppelin中使用z.run从另一个段落中触发一个段落。当我在Apache Zeppelin上运行...

回答 1 投票 1

把一个大文件写到S3的最好方法是什么?

我正在使用zeppelin和spark,我想从S3中获取一个2TB的文件,并在Spark中对其进行变换,然后将其上传到S3,这样我就可以在Jupyter笔记本中使用该文件。这个...

回答 1 投票 0

我如何打印出一个spark.sql对象?

我有一个spark.sql对象,其中包括几个变量。 import com.github.nscala_time.time.Imports.LocalDate val first_date = new LocalDate(2020, 4, 1) val second_date = new LocalDate(2020, 4, ...)

回答 1 投票 0

我可以在程序上运行Zeppelin笔记本吗?

我有Zeppelin在Hadoop之上,有一个Spark集群。我想在一个笔记中运行前五段,然后在另一个笔记中运行前五段。我不想让它们在同一时间运行 ...

回答 1 投票 0

工作65被取消,因为SparkContext被关闭。

我在一个共享的Apache Zeppelin服务器上工作。几乎每天,我都会尝试运行一个命令,并得到这个错误。Job 65 cancelled because SparkContext was shut down 我很想知道更多关于... I would love to learn more about what...

回答 1 投票 0

如何让Apache ZeppelinShiro在不同的端口(不是8080)上工作?

Apache Zeppelin 0.9.0 preview1包括基本的Shiro auth,只要在confzeppelin-site.xml中指定的zeppelin.server.port是8080,就可以正常工作。然而,我想使用另一个端口(例如9000)来进行 ...

回答 1 投票 0

我可以在Zeppelin中以编程方式检查一个段落的状态吗?

我在Spark集群上使用Zeppelin与Hadoop。我想检查一个段落的状态,看看它是成功、运行、不运行还是错误。我知道我可以滚动到段落,然后......

回答 1 投票 0

我可以在Spark中清除环境变量吗?

我在Spark集群上使用Zeppelin与Hadoop。我想定义变量,然后清除它们。 val myvar = 1 我想能够myvar,并让它不再等于1。

回答 1 投票 0

我可以在zeppelin的`sh`命令中包含一个变量吗?

我在Spark集群上使用Zeppelin与Hadoop。我想运行一个命令来检查s3上的文件,我想使用一个变量。这是我的代码 %sh aws s3 ls s3:/my-bucketmy_folder 我可以 ...

回答 1 投票 0


如何使用angular脚本在WHERE子句的查询界面的下拉菜单中添加额外的功能,如操作符,条件子句?

我试图添加一些额外的功能,就像在superset中一样,比如在WHERE子句中有一个下拉菜单,其中提到了几个操作,如EQUAL TO,NOT EQUAL TO,GREATER THAN等。

回答 1 投票 0

为什么火花中的一些音符工作得很慢,为什么在同一情况下多次执行的时间不同?

我的问题是关于pyspark代码在zeppelin中的执行时间。我有一些笔记,我在其中使用了一些SQL,在我的一个笔记中,我用.topandas()函数将我的数据框架转换为panda......。

回答 1 投票 0

我如何重新启动已停止的Spark上下文?

我正在用Apache齐柏林飞艇和hadoop运行Spark。我的理解是Zeppelin就像一个kube应用程序,它将命令发送到运行Spark并使用Hadoop访问文件的远程计算机。我...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.