Google Cloud Speech API使开发人员能够通过在易于使用的API中应用强大的神经网络模型将音频转换为文本
如何使用 Node.js 通过 Google Cloud Speech-to-Text API 实现语音识别?
我是 Google Cloud 新手, 我最近创建了一个带有 Speech-to-Text API 的项目。 创建项目并将其链接到计费帐户后,我访问了 Node.js 控制台教程以快速了解
当我在 Google Speech to text api 中启用扬声器分类时,扬声器标签是什么?
当我在谷歌语音到文本API中启用说话者分类时,我会得到每个单词的说话者标签。这些标签是什么?他们的意思是什么?当我给说话者计数 2 时,我有时会得到标签 0 和 2 以及
如何使用纯 JavaScript 向 Google Cloud Speech To Text 发送 HTTP POST 请求
我正在创建 Unity WebGL 版本,并且必须在我的应用程序中使用 Google Cloud Speech To Text API。 Unity 在 WebGL 构建中不支持麦克风,但有一个使用 jslib 文件的解决方法
Google Cloud Speech-To-Text API 响应不返回单词
我正在尝试使用 Google Cloud Speech-To-Text API 和 Python 在我的应用程序中实现 Speech-To-Text。我正确地得到了转录,但是响应仅包含转录和
Google Cloud 语音转文本 v2 给出错误解码配置:必需的一个字段“解码配置”必须有一个初始化字段
这是我的要求: 发布到:https://us-central1-speech.googleapis.com/v2/projects/{SECRET}/locations/us-central1/recognizers/_:batchRecognize { “处理策略”:“DYNAMIC_BATC...
我正在尝试使用 dotnet Google.Cloud.Speech.V2 库运行“chirp”模型的转录。我需要使用 chirp,因为我需要用波兰语标点符号进行转录,而 chirp 是...
云语音转文本,cUrl 进行语音:识别请求,从我的存储桶访问文件
我正在使用本教程:https://cloud.google.com/speech-to-text/docs/transcribe-api?_ga=2.111344076.-975712240.1702582049 但我想进一步复制
我了解云语音转文本的数据记录默认情况下处于禁用状态。 Google Cloud 在处理呼叫时真的不会记录呼叫吗?到底记录了什么?日志会发生什么情况...
每次我使用语音发短信时,作品“是”都会添加到每个句子的前面。我从不说“是”这个词来开始一个句子。你如何解决这个问题? 我已经重置手机了...
Google Speech-To-Text v2 不接受 Node.JS 中的音频
我已经尝试了几天使用 Node.JS 迁移到 Google STT V2。在 v1 中一切都很完美。我创建了一个识别器并使用 https://github.com/
` 您好,我在从 V1 迁移到 V2 api 时遇到问题, 我在 V1 中使用如下依赖项 ` com.google.cloud 谷歌云-
需要指导:使用云语音转文本 API C++ 客户端库进行语音活动检测和超时处理
我的场景非常基本:在用户唤醒词之后(我不使用 Google 语音),我开始将麦克风数据发送到 Google 语音识别服务。我正在尝试解决的问题
使用 Google Speech-to-Text 实现 Twilio Media Streams 的 Python 实现,不进行转录(使用 JavaScript)
我正在开发一个使用 Twilio Media Streams 和 Google 的 Speech-to-Text API 转录电话的项目。我有一个可以完美运行的 JavaScript 实现,但是当我尝试重写时......
如何设置流式传输在 Node.js 中识别 Google Cloud Speech To Text V2?
我正在尝试在 Node.js 中设置 StreamingRecognize() Google Cloud Speech to Text V2 以用于流式传输音频数据,并且在初始识别器请求设置时它总是向我抛出相同的错误...
google Cloud Speech-to-Text V1 和 v2 有什么区别
我的代码项目框架是springboot+maven,版本是 com.google.cloud 谷歌云语音 我的代码项目框架是springboot+maven,版本是 <dependency> <groupId>com.google.cloud</groupId> <artifactId>google-cloud-speech</artifactId> <version>1.24.3</version> </dependency> 当我使用2.3.0时,代码给了我一个错误。 <dependency> <groupId>com.google.cloud</groupId> <artifactId>google-cloud-speech</artifactId> <!-- <version>1.24.3</version>--> <version>2.3.0</version> </dependency> 这是错误消息: Exception in thread "pool-4-thread-1" Exception in thread "pool-3-thread-1" java.lang.NoSuchMethodError: io.grpc.internal.AbstractManagedChannelImplBuilder: method <init>()V not found at io.grpc.netty.shaded.io.grpc.netty.NettyChannelBuilder.<init>(NettyChannelBuilder.java:200) at io.grpc.netty.shaded.io.grpc.netty.NettyChannelBuilder.forTarget(NettyChannelBuilder.java:169) at io.grpc.netty.shaded.io.grpc.netty.NettyChannelBuilder.forAddress(NettyChannelBuilder.java:152) at io.grpc.netty.shaded.io.grpc.netty.NettyChannelProvider.builderForAddress(NettyChannelProvider.java:38) at io.grpc.netty.shaded.io.grpc.netty.NettyChannelProvider.builderForAddress(NettyChannelProvider.java:24) at io.grpc.ManagedChannelBuilder.forAddress(ManagedChannelBuilder.java:39) at com.google.api.gax.grpc.InstantiatingGrpcChannelProvider.createSingleChannel(InstantiatingGrpcChannelProvider.java:350) at com.google.api.gax.grpc.ChannelPool.<init>(ChannelPool.java:105) at com.google.api.gax.grpc.ChannelPool.create(ChannelPool.java:83) at com.google.api.gax.grpc.InstantiatingGrpcChannelProvider.createChannel(InstantiatingGrpcChannelProvider.java:236) at com.google.api.gax.grpc.InstantiatingGrpcChannelProvider.getTransportChannel(InstantiatingGrpcChannelProvider.java:230) at com.google.api.gax.rpc.ClientContext.create(ClientContext.java:201) at com.google.cloud.speech.v1p1beta1.stub.GrpcSpeechStub.create(GrpcSpeechStub.java:95) at com.google.cloud.speech.v1p1beta1.stub.SpeechStubSettings.createStub(SpeechStubSettings.java:133) at com.google.cloud.speech.v1p1beta1.SpeechClient.<init>(SpeechClient.java:134) at com.google.cloud.speech.v1p1beta1.SpeechClient.create(SpeechClient.java:116) at com.google.cloud.speech.v1p1beta1.SpeechClient.create(SpeechClient.java:108) at com.duplicall.ibaeonline.EngineClients.google.InfiniteStreamRecognize.infiniteStreamingRecognize(InfiniteStreamRecognize.java:95) at com.duplicall.ibaeonline.EngineClients.google.InfiniteStreamRecognize.lambda$StartTrans$0(InfiniteStreamRecognize.java:291) at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149) at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624) at java.lang.Thread.run(Thread.java:748) java.lang.NoSuchMethodError: io.grpc.internal.AbstractManagedChannelImplBuilder: method <init>()V not found at io.grpc.netty.shaded.io.grpc.netty.NettyChannelBuilder.<init>(NettyChannelBuilder.java:200) at io.grpc.netty.shaded.io.grpc.netty.NettyChannelBuilder.forTarget(NettyChannelBuilder.java:169) at io.grpc.netty.shaded.io.grpc.netty.NettyChannelBuilder.forAddress(NettyChannelBuilder.java:152) at io.grpc.netty.shaded.io.grpc.netty.NettyChannelProvider.builderForAddress(NettyChannelProvider.java:38) at io.grpc.netty.shaded.io.grpc.netty.NettyChannelProvider.builderForAddress(NettyChannelProvider.java:24) at io.grpc.ManagedChannelBuilder.forAddress(ManagedChannelBuilder.java:39) at com.google.api.gax.grpc.InstantiatingGrpcChannelProvider.createSingleChannel(InstantiatingGrpcChannelProvider.java:350) at com.google.api.gax.grpc.ChannelPool.<init>(ChannelPool.java:105) at com.google.api.gax.grpc.ChannelPool.create(ChannelPool.java:83) at com.google.api.gax.grpc.InstantiatingGrpcChannelProvider.createChannel(InstantiatingGrpcChannelProvider.java:236) at com.google.api.gax.grpc.InstantiatingGrpcChannelProvider.getTransportChannel(InstantiatingGrpcChannelProvider.java:230) at com.google.api.gax.rpc.ClientContext.create(ClientContext.java:201) at com.google.cloud.speech.v1p1beta1.stub.GrpcSpeechStub.create(GrpcSpeechStub.java:95) at com.google.cloud.speech.v1p1beta1.stub.SpeechStubSettings.createStub(SpeechStubSettings.java:133) at com.google.cloud.speech.v1p1beta1.SpeechClient.<init>(SpeechClient.java:134) at com.google.cloud.speech.v1p1beta1.SpeechClient.create(SpeechClient.java:116) at com.google.cloud.speech.v1p1beta1.SpeechClient.create(SpeechClient.java:108) at com.duplicall.ibaeonline.EngineClients.google.InfiniteStreamRecognize.infiniteStreamingRecognize(InfiniteStreamRecognize.java:95) at com.duplicall.ibaeonline.EngineClients.google.InfiniteStreamRecognize.lambda$StartTrans$0(InfiniteStreamRecognize.java:291) at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149) at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624) at java.lang.Thread.run(Thread.java:748) 我不知道V1和V2之间的区别。我认为google-cloud-speech版本升级应该是向后兼容的。如果您熟悉该产品请评论 查看官方代码; V1: https://github.com/googleapis/google-cloud-java/blob/main/java-speech/samples/snippets/ generated/com/google/cloud/speech/v1/speech/streamingrecognize/AsyncStreamingRecognize.java public static void asyncStreamingRecognize() throws Exception { // This snippet has been automatically generated and should be regarded as a code template only. // It will require modifications to work: // - It may require correct/in-range values for request initialization. // - It may require specifying regional endpoints when creating the service client as shown in // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library try (SpeechClient speechClient = SpeechClient.create()) { BidiStream<StreamingRecognizeRequest, StreamingRecognizeResponse> bidiStream = speechClient.streamingRecognizeCallable().call(); StreamingRecognizeRequest request = StreamingRecognizeRequest.newBuilder().build(); bidiStream.send(request); for (StreamingRecognizeResponse response : bidiStream) { // Do something when a response is received. } } } V2: https://github.com/googleapis/google-cloud-java/blob/main/java-speech/samples/snippets/ generated/com/google/cloud/speech/v2/speech/streamingrecognize/AsyncStreamingRecognize.java public static void asyncStreamingRecognize() throws Exception { // This snippet has been automatically generated and should be regarded as a code template only. // It will require modifications to work: // - It may require correct/in-range values for request initialization. // - It may require specifying regional endpoints when creating the service client as shown in // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library try (SpeechClient speechClient = SpeechClient.create()) { BidiStream<StreamingRecognizeRequest, StreamingRecognizeResponse> bidiStream = speechClient.streamingRecognizeCallable().call(); StreamingRecognizeRequest request = StreamingRecognizeRequest.newBuilder() .setRecognizer( RecognizerName.of("[PROJECT]", "[LOCATION]", "[RECOGNIZER]").toString()) .build(); bidiStream.send(request); for (StreamingRecognizeResponse response : bidiStream) { // Do something when a response is received. } } } 这和maven引用的版本有关系吗?
如何使用 GC 文本转语音 API - Studio Voice
我正在尝试使用 en-US-Studio-O 语音,但是当我添加此语音(以及其他非标准语音)时,它会给出错误 400。我也尝试过使用非 beta 端点(v1 )。 var untext =
我正在试验谷歌云语音到文本服务。它工作正常,但我无法更新 google-cloud-speech 的版本。如果我放更新的版本而不是 0.41.0-alpha,它会抛出这个
无法使用语音识别解决缺少的 google-api-python-client 模块
我正在尝试在安装了 Armbian 的 tinkerboard 上运行语音识别。我总是收到这个错误 错误 - 从缺少 google-api-python-
Google Cloud Speech-to-text API 在 python 中添加一个短语集
我目前正在使用谷歌云的语音到文本 api 来转录一个长音频文件。我已经设法通过编写一个 python 脚本来设置它来做到这一点,但我想添加一个自定义短语集来展示...
仅使用 Google Speech to Text API 中的项目密钥访问位置
我正在做一个项目,我正在使用 Google 的 Speech to Text API。 我想为我选择的一些词分配提升值 我为此使用了 SpeechAdaption。 但是她的问题...