google-cloud-dataflow 相关问题

Google Cloud Dataflow是一种完全托管的云服务，可用于大规模创建和评估数据处理管道。数据流管道基于Apache Beam编程模型，可以在批处理和流模式下运行。 Cloud Dataflow是Google云端平台的一部分。

我有一个PCollection 在Google Cloud DataFlow中，我通过TextIO.Write.to将其输出到文本文件：PCollection lines = ...; lines.apply（TextIO.Write.to（“GS：//桶/ ...

google-cloud-dataflow

回答 1 投票 1

TextIO.read（）。watchForNewFiles（）阻止写入BigQuery

我正在尝试创建一个管道，等待GCS文件夹中的新csv文件来处理它们并将输出写入BigQuery。我编写了以下代码：public static void main（String [] args）{...

google-cloud-dataflow apache-beam

回答 2 投票 0

数据流：我可以使用批处理作业连续写/流写入BigQuery吗？

我似乎无法找到任何关于此的文档。我有一个apache-beam管道，它接收一些信息，将其格式化为TableRows，然后写入BigQuery。 [+]问题：行是......

google-bigquery google-cloud-dataflow apache-beam

回答 2 投票 1

TableRow.get上的Google Cloud Dataflow，BigQueryIO和NullPointerException

我是GC Dataflow的新手，并没有找到相关的答案。如果我发现这已经得到回答，请道歉。我正在尝试使用v2.0 SDK创建一个简单的管道，但我遇到了麻烦......

google-bigquery google-cloud-dataflow

回答 3 投票 0

通过Dataflow管道写入Cloud SQL非常慢

我设法通过JDBCIO DataSourceConfiguration.create连接到云sql（“com.mysql.jdbc.Driver”，“jdbc：mysql：// google /？cloudSqlInstance = ::＆socketFactory = com.google.cloud.sql.mysql .. ..

google-cloud-platform google-cloud-dataflow google-cloud-sql

回答 1 投票 0

输出具有空值的TableRow时出现NullPointerException

我正在尝试构建一个TableRow对象，最终将其写入BigQuery表，但如果我在行中包含空值，则会出现NullPointerException。这是完整的堆栈跟踪：例外...

java google-cloud-dataflow apache-beam

回答 3 投票 0

Python Apache Beam：日期值超出范围

应用此示例或此示例来构建我的程序，每次我尝试插入Big Query时，都会出现此错误：OverflowError：日期值超出范围[运行'Format'时] My Beam Pipeline是这样的：...

python google-cloud-dataflow apache-beam

回答 1 投票 1

使用Dataflow指定自定义用户代理

我正在尝试通过PipelineOptions.setUserAgent自定义用于不同GCP调用的用户代理。但是，似乎总是回到Apache_Beam_SDK_for_Java / 2.6.0。看着......

google-cloud-dataflow apache-beam

回答 1 投票 1

数据流：动态工作重新平衡与融合

动态工作重新平衡将最佳地将工作分配给工作人员，其中融合将使执行图崩溃，从而图表将更小，意味着更少的工作人员参与。动态工作如何......

google-cloud-dataflow apache-beam

回答 2 投票 0

DirectRunner不会按照我在Beam Java SDK中使用FixedWindows指定的方式读取Pub / Sub

我目前正在开发一个Dataflow管道，它使用Apache Beam Java SDK 2.8.0从Pub / Sub读取流数据。该管道只是Google的PubsubToText.java模板。 https：//开头的github ....

java google-cloud-dataflow apache-beam google-cloud-pubsub

回答 1 投票 0

是否可以在两个PCollections的apache梁上进行拉链操作？

我有一个PCollection [str]，我想生成随机对。来自Apache Spark，我的策略是：复制原始PCollection随机随机播放它与原始PCollection拉链...

google-cloud-dataflow apache-beam

回答 2 投票 0

google-cloud-dataflow 相关问题

最新问题