google-cloud-speech 相关问题

Google Cloud Speech API使开发人员能够通过在易于使用的API中应用强大的神经网络模型将音频转换为文本

Google 语音转文本功能可以离线使用吗?

我想利用 Google 的语音转文本服务来开发桌面应用程序,但我希望它能够离线。这可能吗? 他们有本地解决方案,但是否可以离线以便不发送数据?

回答 3 投票 0

Google Speech-To-Text 服务是否支持 OGG_OPUS 或 WEBM_OPUS 进行实时流媒体识别?

我能够使用 LINEAR16 编码使其工作,但不能使用 OGG_OPUS。那么问题来了,真的支持吗?不幸的是,我在文档中没有找到任何相关信息。

回答 1 投票 0

如何在Android中播放.opus音频文件? [已关闭]

我正在开发一个应用程序,用于使用 Google 云语音 API 识别语音并同时录制音频:GitHub 链接。 我尝试播放录制的 .opus 音频文件,但出现 IOException 带系统...

回答 3 投票 0

多语言Google TTS句子

我正在尝试谷歌云TTS服务,我想知道是否支持多语言文本合成。 具体来说,我正在尝试合成一个包含希腊语和英语的句子......

回答 2 投票 0

如何将音频文件媒体发送到 twilio 流电话

我基本上是通过使用 twilio 的电话构建一个简单的 GPT 助手,使用谷歌云语音转录用户的输入。现在我有一个示例 tts_output4 音频文件...

回答 1 投票 0

Google Cloud Speech:区分声音?

我有兴趣编写一个能够识别多个扬声器的语音识别应用程序。例如,如果比尔、乔和简正在说话,那么应用程序不仅可以将声音识别为...

回答 6 投票 0

React Native 项目中的 google 翻译 api 错误 401

我通过云为 Google Translate 创建了一个帐户,创建了一个 API 密钥并获取了凭据信息。 Api url 在 Postman 中工作没有任何问题。我还创建了一个react.js Web项目......

回答 1 投票 0

在流识别Python代码中使用生成器

我很难理解与块生成器和转录过程相关的Python脚本摘录的动态。 这是完整的代码:https://cloud.google.com/speech-to-text/docs/

回答 1 投票 0

Google Voice2Text 无法转录音频文件 - 总计费时间未知

我正在尝试转录一个ogg文件(也尝试过wav)并且总是收到错误: 解析期间发生错误: 解析期间发生错误:totalBilledTime 未知。 我正在使用 PHP 8...

回答 1 投票 0

Android 语音识别器无法工作。语言包问题?

我们的应用程序“ConverStory”的语音识别器部分最近突然停止在某些设备上工作。 https://play.google.com/store/apps/details?id=com.converstory。我们使用...

回答 1 投票 0

无法在 ESP32 上与 google 云语音转文本执行握手。 [PK - 公钥标签或值无效(仅支持 RSA 和 EC)]

我正在尝试与speech.googleapis.com建立连接。我正在使用 https://github.com/MhageGH/esp32_CloudSpeech/tree/master/esp32_CloudSpeech 中的代码。我修改了network_param.h...

回答 1 投票 0

任何人都可以建议一些方法来模拟 Go 中的 Google Cloud Speech-v2 gRPC 语音客户端吗

导入( “语境” “FMMT” 语音包(“cloud.google.com/go/speech/apiv2”) ) 函数 GSTTClient() { ctx := context.Background() opts := []选项。

回答 1 投票 0

谷歌云语音导入错误:无法导入名称“枚举”

我正在为我的项目使用 google-cloud-speech api 。我正在使用 Pipenv 作为虚拟环境,我安装了 google-cloud-speech api pipelinev 安装 google-cloud-speech 和 Pipenv 更新好...

回答 4 投票 0

语音转文本 API 文档问题

我正在查看 Speech-to-Text API,但有一些问题: v1 和 v1p1 有什么区别? Speech-to-Text v2 中的 chirp 模型是否支持从 stre 转录音频...

回答 1 投票 0

Python Google Speech to Text 超时“操作已取消”

我正在尝试使用 Google 语音文本来实时转录麦克风中的音频。我还想设置一个超时时间,规定 Google 在超时之前等待的时间。我尝试过使用

回答 1 投票 0

使用 Google Speech-to-Text v2 转录流音频时出现总计费持续时间问题

我们开始使用 Google v2 进行长音频的流转录。我们遇到的问题是,在对话的每一步(每一次停顿)中,我们都会收到“isFinal=t...

回答 1 投票 0

400 音频超时错误:长时间没有音频。音频应接近实时发送

我正在尝试使用流音频输入谷歌的语音到文本。 我有一个简单的 JS 代码,该代码在按下按钮时记录音频并使用 websockets 将音频发送到 fastapi 后端。在 fastapi 中...

回答 1 投票 0

升级到 SpeechClient v1 时出现身份验证问题

在项目中我们一直使用google/cloud包的SpeechClient。我现在正在将其升级到未弃用的 /V1/SpeechClient,但我遇到了以下问题...

回答 1 投票 0

如何使用 Node.js 通过 Google Cloud Speech-to-Text API 实现语音识别?

我是 Google Cloud 新手, 我最近创建了一个带有 Speech-to-Text API 的项目。 创建项目并将其链接到计费帐户后,我访问了 Node.js 控制台教程以快速了解

回答 1 投票 0

当我在 Google Speech to text api 中启用扬声器分类时,扬声器标签是什么?

当我在谷歌语音到文本API中启用说话者分类时,我会得到每个单词的说话者标签。这些标签是什么?他们的意思是什么?当我给说话者计数 2 时,我有时会得到标签 0 和 2 以及

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.