我有一个用例,我想要:
典型的问题是,转录模型不会返回说出的每个单词的时间(开始/结束时间)。因此,根据 PII 定位转录输出变得非常困难。
有人想出了解决同样问题的方法吗?本地模型或基于 API 的服务,一切都很好,某些方向就是我正在寻找的。
我面临着完全相同的挑战。我不编码,但如果需要,我可以联系内部开发人员。
有更新吗..?
蒂亚