Apache Zeppelin是一款基于Web的笔记本电脑,支持数据驱动的交互式数据分析。您可以使用SQL,Python,Scala等制作精美的数据驱动,交互式和协作文档。它还支持Markdown语法。
如何自动更新zeppelin中的%spark.sql结果以进行结构化流式查询
我正在(来自zeppelin 0.7的spark 2.1.0中运行结构化流,用于来自kafka的数据,我正尝试通过spark.sql可视化流的结果,如下所示:%spark2 val spark = ...
我正在将Zeppelin笔记本与%livy.pyspark解释器一起使用。我正在Hadoop Hive表上运行SQL查询,并希望查看该表的几行内容。我正在使用以下代码:'''%livy.pyspark from ...
我使用齐柏林0.8.0和我有哪里飞艇表视图将字符串转换为数字的问题。在下面的代码段中的数据帧包含字符串“007”。这显示...
我找不到获取Apache zeppelin 0.9.0二进制文件的方法。我认为曾经有一个下载页面,因此被删除了。有人可以帮我吗?谢谢,Ori
我使用Apache的飞艇,我可以从两个Postgres的结果,并分别clickhouse。但是,我需要合并两个查询。
NoSuchMethodException:运行pyspark代码齐柏林时scala.tools.nsc.interpreter.ILoop.scala
我想运行一个飞艇细胞pyspark,但我得到的scala.tools.nsc.interpreter.ILoop.scala细胞代码NoSuchMethodException:%pyspark打印(“你好”)错误:java.lang中....
我尝试请求与蜂房和齐柏林蜂巢数据库,但我得到这个错误:SemanticException无法提取与表table_name。 org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.ipc ....
我在本地系统中创建一个飞艇码头工人形象和配置为通过Maven仓库星火解释并拼命地跑齐柏林它的工作。但是,当我停止泊坞窗,再次拼命地跑......
飞艇java.lang.OutOfMemoryError:GC开销超过限制
我在飞艇org.apache.spark.SparkException得到一个错误:作业已中止。与描述产生的原因:java.lang.OutOfMemoryError:GC开销超过限制。星火监测表明,GC了...
问题:我想从通过Jupyter API其他应用程序与Jupyter互动,特别是我想从应用程序运行我的笔记本电脑至少(完美的变种,我是编辑一些段落......
我用的飞艇,我想检查一个变量定义(我们一般定义一个变量VAR两种或Val)上阶的环境或没有。例如:我想知道,如果我的斯卡拉环境(在其他...
我已经使用Apache齐柏林0.8.1。我想用户Groovy解释。并使用@Grape出发menagement:%常规@Grapes([@Grab( 'com.github.twosigma.beakerx:烧杯内核常规:0.9.0')])进口玉米....
我用的飞艇0.6.1-SNAPSHOT与其它内存计算平台被称为insightedge捆绑在一起。我想导入其他笔记本电脑到我的飞艇部署需要命令解释程序(...
我想数据框导出到.csv文件S3桶。不幸的是它是在实木复合地板文件保存。有人可以请让我知道,如何让出口pyspark数据帧为.csv文件。一世 ...
我无法运行以下代码行。来自pyspark.sql import SQLContext sqlContext = SQLContext(sc)df_t = sqlContext.read.format('com.databricks.spark.csv')。options(header ='true',inferschema ='...
我在我的Mac上安装了火花,当我在终端中运行spark-submit作业或者使用spark-shell时,一切正常。我也安装了Zeppelin,但是当我尝试在...中运行一个简单的sc时
在SQL查询中,zeppelin 0.8.1提供了表输出和开箱即用的数据可视化:并且它在大多数情况下非常有用。但有时我只想选择文字进行演示。 ...
Spark zeppelin:如何在%pyspark解释器中获取%sql结果?
我知道我可以使用%pyspark df = sqlContext.sql('select * from train_table')我可以使用df.registerTempTable('xxx')在%sql中使df可访问。但有时我想使用%sql绘制...
我在EMR上使用Zeppelin v0.5.6。我无法按照我正在绘制的指标排序条形图。作为一个虚拟示例,我希望条形图显示col2 ordered - sc.parallelize(Range(0,10).map(...
我正在使用AWS EMR集群。我一直在尝试使用Spark Drivers和Apache Zeppelin Rest API来运行作业。我和Zeppelin一起经营了几百个临时工作,并没有任何顾虑。 ...