外语语音转文本和文本转语音

问题描述 投票:2回答:1

我正在考虑将我打造的一款语音2D HTML5网页游戏移植到iPhone和Android的Unity2D上。我是一个全栈的web开发者,而不是Unity开发者,所以一个机构会帮我构建Unity应用。在与他们签约之前,我需要确定双方的 Speech to Text (STT)Text to Speech (TTS) 可提供的服务有 普通话, 西班牙语英文,否则我会在前期浪费很多钱。

对于网络,Webkit Speech (STT文件, STT演示, TTS文件, TTS演示)很容易通过浏览器访问。我发现,IBM Watson有一个API可用,并且有演示用于 STTTTS我发现他们有一个。Unity SDK 在这里,但我没有测试Unity SDK的技能。

我想请教一下优秀的STT和TTS API,机构可以用这三种外语。

  1. Unity SDK是否提供对前端STT和TTS音频流的支持?STT需要捕捉用户的语音输入并快速转录。同样,TTS需要允许用户悬停在目标语言单词上,并听取接近母语的发音。
  2. 它是否同时提供西班牙语、普通话和英语的STT和TTS?
  3. 还有哪些NLP API能满足我的要求?

很抱歉,我对Unityphone的开发完全是个新手,所以这里的任何指导都会非常有帮助。如果没有符合这些要求的API存在,那么Unity将无法为我的应用工作,因为STT和TTS是至关重要的。

c# unity3d speech-recognition
1个回答
2
投票

总的来说,Unity中的实时音频录制很糟糕,系统根本不是为了连续录制音频而设计的。你可以用录制一个片段 音源 但这是一个固定长度的剪辑,而不是一个流媒体解决方案。

对于流媒体,你可以得到的音频与 音频过滤阅读 但它并不是真正用于录音的API,更多的是用于效果。对于录制来说,它有不可预知的延迟,同时也大大降低了UI的速度。

因此,你只能进行推送对话式的交互,而不能进行实时交互。

如果你有其他的选择,你最好也考虑一下。例如,你可以考虑原生应用。

© www.soinside.com 2019 - 2024. All rights reserved.