#4005 为什么我的字幕有时候跟说的不一样。比如(小妙招)三个字。录入的时候没问题,说的没问题。但是显示的却是(小米)两个字。这个应该怎么解决。谢谢

185.34* Posted at: 5 hours ago 👁12

为什么我的字幕有时候跟说的不一样。比如(小妙招)三个字。录入的时候没问题,说的没问题。但是显示的却是(小米)两个字。这个应该怎么解决。谢谢

1 Replies

这是由于语音识别模型在特定词汇上的准确度不足导致的,尤其是对于短促、发音相近的词汇(如“小妙招”被误识别为“小米”)。

解决方案:

  1. 提升识别模型:在“语音识别”下拉菜单中,将模型更换为更精确的版本。对于中文视频,建议选择:

    • faster-whisper(本地)openai-whisper(本地),并将右侧模型选择为 large-v3
    • 或直接使用 qwen-asr(本地),该模型对中文优化更好。
    • 注意:使用 large-v3 模型需要足够的显存(建议10GB以上)或内存(16GB以上)。
  2. 优化识别参数:点击 菜单 -> 工具 -> 高级选项,在“语音识别参数”区域进行如下调整以提高准确性:

    • 语音阈值:保持默认 0.5(过低易引入噪音,过高可能漏字)。
    • 最长语音持续秒数:设为 6 或更大(如 10),避免长句被不合理切断。
    • no speech threshold:适当减小此值(例如从默认值调低),可降低模型“幻觉”(即生成未说出内容)的概率,但需注意可能增加将背景噪音误识别为语音的风险。
  3. 使用热词提示:在“高级选项”的“语音识别参数”区域,找到 热词 输入框。将容易识别错误的词汇(如“小妙招”)填入,用英文逗号分隔多个词汇(例如:小妙招,专业术语,品牌名)。这能引导模型优先考虑这些词汇。
  4. 确保语言设置正确:在主界面“发音语言”中,必须明确选择与视频说话语言一致的选项(例如“中文”),不要依赖“自动检测”。
  5. 开启降噪:如果视频背景有杂音,勾选主界面上的 降噪 选项,可以在识别前先净化音频。
  6. 强制重新识别:如果之前处理过该视频,软件会使用缓存结果。请勾选主界面左上角的 清理已生成 复选框,然后重新处理。

请查阅相关文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource