使用转录/其他技术从音频文件获取 PII 持续时间（开始结束时间）

问题描述投票：0回答：1

我有一个用例，我想要：

查找任何给定音频文件中的所有 PII 数据（完成：使用 GPT/类似模型）
转录音频，然后屏蔽文本文件中的所有 PII（使用耳语/类似模型完成）
此外，在原始音频中，用蜂鸣声掩盖了 PII 部分。（剩余）

典型的问题是，转录模型不会返回说出的每个单词的时间（开始/结束时间）。因此，根据 PII 定位转录输出变得非常困难。

有人想出了解决同样问题的方法吗？本地模型或基于 API 的服务，一切都很好，某些方向就是我正在寻找的。

python audio wav openai-api large-language-model

1个回答

0
投票

我面临着完全相同的挑战。我不编码，但如果需要，我可以联系内部开发人员。

有更新吗..？

蒂亚

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.