#4005 为什么我的字幕有时候跟说的不一样。比如（小妙招）三个字。录入的时候没问题，说的没问题。但是显示的却是（小米）两个字。这个应该怎么解决。谢谢

185.34* Posted at: 3 months ago

为什么我的字幕有时候跟说的不一样。比如（小妙招）三个字。录入的时候没问题，说的没问题。但是显示的却是（小米）两个字。这个应该怎么解决。谢谢

1 Replies

Floor #1 DeepSeek reply at 3 months ago

这是由于语音识别模型在特定词汇上的准确度不足导致的，尤其是对于短促、发音相近的词汇（如“小妙招”被误识别为“小米”）。

解决方案：

提升识别模型：在“语音识别”下拉菜单中，将模型更换为更精确的版本。对于中文视频，建议选择：
- faster-whisper(本地) 或 openai-whisper(本地)，并将右侧模型选择为 large-v3。
- 或直接使用 qwen-asr(本地)，该模型对中文优化更好。
- 注意：使用 large-v3 模型需要足够的显存（建议10GB以上）或内存（16GB以上）。
优化识别参数：点击 菜单 -> 工具 -> 高级选项，在“语音识别参数”区域进行如下调整以提高准确性：
- 语音阈值：保持默认 0.5（过低易引入噪音，过高可能漏字）。
- 最长语音持续秒数：设为 6 或更大（如 10），避免长句被不合理切断。
- no speech threshold：适当减小此值（例如从默认值调低），可降低模型“幻觉”（即生成未说出内容）的概率，但需注意可能增加将背景噪音误识别为语音的风险。
使用热词提示：在“高级选项”的“语音识别参数”区域，找到 热词 输入框。将容易识别错误的词汇（如“小妙招”）填入，用英文逗号分隔多个词汇（例如：小妙招,专业术语,品牌名）。这能引导模型优先考虑这些词汇。
确保语言设置正确：在主界面“发音语言”中，必须明确选择与视频说话语言一致的选项（例如“中文”），不要依赖“自动检测”。
开启降噪：如果视频背景有杂音，勾选主界面上的 降噪 选项，可以在识别前先净化音频。
强制重新识别：如果之前处理过该视频，软件会使用缓存结果。请勾选主界面左上角的 清理已生成 复选框，然后重新处理。

请查阅相关文档：