我正在寻找构建一个用于实时语音翻译的 Microsoft Teams 插件。要求是:
该插件应访问 Microsoft Teams 会议的音频流。
以说话者的语言提供音频流的实时转录(语音到文本)。例如 - 如果说话者用英语说话,请提供英语实时转录。
提供文本同步实时翻译。例如 - 提供日语实时翻译。
我有一个人工智能模型来实现上述步骤 2 和 3。但是,我不知道如何实现步骤 1,即如何构建可以实时运行我的 AI 模型的 Teams 插件。
我一直在探索 Microsoft Teams 开发人员文档 (https://learn.microsoft.com/en-us/microsoftteams/platform/mstdd-landing),但内容太多,我有点迷失了。
目前,我正在尝试使用 Microsoft Azure 创建一个实时媒体机器人。此事仍在进行中—— https://learn.microsoft.com/en-us/microsoftteams/platform/bots/calls-and-meetings/real-time-media-concepts https://dev.botframework.com/bots/new
如果有人可以分享如何构建用于实时语音翻译的 Teams 插件的开发经验,那就太好了。谢谢你。
您好@Sayali 和@amit 我们正在寻找一种在使用 Node.js 进行 Microsoft Teams 通话时获取实时音频和视频流的方法。我们查看了 Microsoft 文档,似乎他们只支持使用 C# 和 .NET 进行实时流式传输。
有没有办法使用 Node.js 来实现这一点,或者是否有任何解决方法或第三方库可以帮助我们实时访问 Teams 音频和视频流?
任何指导或建议将不胜感激!