我有一个文本文件。我使用 TTS 生成画外音 wav 文件。如何为其生成字幕? 我根据情况使用 Azure 和/或 Coqui-AI TTS。
我目前使用离线 openai-Whisper 模型生成字幕。但是,它无法正确识别单词。我如何比较和修复它们? 或者您有其他解决方案吗?
既然我有原始文本文件,应该很容易比较和纠正误识别的单词,但我做不到。
AI绝对可以创作歌曲!有各种工具和平台使用机器学习算法来创作音乐、生成旋律、生成字幕,甚至生成歌词。人工智能生成的歌曲的一些主要特征包括: