使用转录/其他技术从音频文件获取 PII 持续时间(开始结束时间)

问题描述 投票:0回答:1

我有一个用例,我想要:

  1. 查找任何给定音频文件中的所有 PII 数据(完成:使用 GPT/类似模型)
  2. 转录音频,然后屏蔽文本文件中的所有 PII(使用耳语/类似模型完成)
  3. 此外,在原始音频中,用蜂鸣声掩盖了 PII 部分。 (剩余)

典型的问题是,转录模型不会返回说出的每个单词的时间(开始/结束时间)。因此,根据 PII 定位转录输出变得非常困难。

有人想出了解决同样问题的方法吗?本地模型或基于 API 的服务,一切都很好,某些方向就是我正在寻找的。

python audio wav openai-api large-language-model
1个回答
0
投票

我面临着完全相同的挑战。我不编码,但如果需要,我可以联系内部开发人员。

有更新吗..?

蒂亚

© www.soinside.com 2019 - 2024. All rights reserved.