#3556 [参数列表] {'name': 'D:/cs.mp4', 'cache_folder': 'd:/pyvideotrans/tmp/46160/519c3dcc9b', 'target_dir': 'd:/pyvideotrans/outp

154.3* Posted at: 4 hours ago 👁6

[参数列表] {'name': 'D:/cs.mp4', 'cache_folder': 'd:/pyvideotrans/tmp/46160/519c3dcc9b', 'target_dir': 'd:/pyvideotrans/output/cs-mp4', 'dirname': 'D:/', 'basename': 'cs.mp4', 'noextname': 'cs', 'ext': 'mp4', 'uuid': '519c3dcc9b', 'source_language_code': 'en', 'target_language_code': 'zh-cn', 'recogn_type': 0, 'model_name': 'tiny', 'is_cuda': False, 'remove_noise': False, 'enable_diariz': False, 'nums_diariz': -1, 'rephrase': 0, 'fix_punc': False, 'tts_type': 0, 'voice_role': 'Yunyang(Male/CN)', 'voice_rate': '+0%', 'volume': '+0%', 'pitch': '+0Hz', 'voice_autorate': True, 'video_autorate': True, 'align_sub_audio': False, 'translate_type': 1, 'is_separate': False, 'recogn2pass': True, 'subtitle_type': 1, 'clear_cache': True}

1 Replies

根据提供的参数列表,核心问题是语音识别模型选择不当,导致识别准确度极低,进而影响后续翻译和配音质量。

问题分析

  1. 语音识别模型过小model_nametiny,这是 faster-whisper 中最小的模型,识别准确度很低,尤其对于非英语内容。
  2. 未启用 GPU 加速is_cudaFalse,处理速度会非常慢。
  3. 目标语言代码格式target_language_codezh-cn,但软件内部通常使用 zhzh-CN,需确认是否兼容。

解决方案

  1. 更换语音识别模型:在软件主界面的“语音识别”下拉菜单中,将模型从 tiny 更改为 large-v3(最佳)或 large-v2。如果显存/内存不足,可考虑 medium 模型。
  2. 启用 CUDA 加速:如果你有 NVIDIA 显卡并已安装 CUDA 12.8 环境,请务必在主界面勾选 CUDA加速 选项。
  3. 验证目标语言:确保“目标语言”选择为“中文(中国)”,软件会自动使用正确的语言代码。
  4. 调整高级参数(可选,针对克隆配音):由于你开启了 recogn2pass(二次识别)且可能使用克隆配音,建议在“菜单-工具-高级选项-语音识别参数”中做如下设置以提高克隆成功率:

    • 最短语音持续毫秒 设为 3000
    • 最长语音持续秒数 设为 10
    • 选中 Whisper预分割音频?合并过短字幕到邻近

最佳实践参考
对于英文视频翻译成中文,建议配置如下:

  • 语音识别faster-whisper(本地) + large-v3 模型 + CUDA加速(如有)。
  • 翻译:使用 AI 渠道(如 DeepSeek、GPT-4)以获得更好质量。
  • 配音Edge-TTS(免费)Qwen-TTS(本地)
  • 对齐:开启 配音加速视频慢速二次识别

请查阅相关文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource

Similar issues already exist