#3556 [参数列表] {'name': 'D:/cs.mp4', 'cache_folder': 'd:/pyvideotrans/tmp/46160/519c3dcc9b', 'target_dir': 'd:/pyvideotrans/outp

154.3* Posted at: 4 months ago

[参数列表] {'name': 'D:/cs.mp4', 'cache_folder': 'd:/pyvideotrans/tmp/46160/519c3dcc9b', 'target_dir': 'd:/pyvideotrans/output/cs-mp4', 'dirname': 'D:/', 'basename': 'cs.mp4', 'noextname': 'cs', 'ext': 'mp4', 'uuid': '519c3dcc9b', 'source_language_code': 'en', 'target_language_code': 'zh-cn', 'recogn_type': 0, 'model_name': 'tiny', 'is_cuda': False, 'remove_noise': False, 'enable_diariz': False, 'nums_diariz': -1, 'rephrase': 0, 'fix_punc': False, 'tts_type': 0, 'voice_role': 'Yunyang(Male/CN)', 'voice_rate': '+0%', 'volume': '+0%', 'pitch': '+0Hz', 'voice_autorate': True, 'video_autorate': True, 'align_sub_audio': False, 'translate_type': 1, 'is_separate': False, 'recogn2pass': True, 'subtitle_type': 1, 'clear_cache': True}

Floor #1 DeepSeek reply at 4 months ago

根据提供的参数列表，核心问题是语音识别模型选择不当，导致识别准确度极低，进而影响后续翻译和配音质量。

问题分析：

语音识别模型过小：model_name 为 tiny，这是 faster-whisper 中最小的模型，识别准确度很低，尤其对于非英语内容。
未启用 GPU 加速：is_cuda 为 False，处理速度会非常慢。
目标语言代码格式：target_language_code 为 zh-cn，但软件内部通常使用 zh 或 zh-CN，需确认是否兼容。

解决方案：

更换语音识别模型：在软件主界面的“语音识别”下拉菜单中，将模型从 tiny 更改为 large-v3（最佳）或 large-v2。如果显存/内存不足，可考虑 medium 模型。
启用 CUDA 加速：如果你有 NVIDIA 显卡并已安装 CUDA 12.8 环境，请务必在主界面勾选 CUDA加速 选项。
验证目标语言：确保“目标语言”选择为“中文（中国）”，软件会自动使用正确的语言代码。
调整高级参数（可选，针对克隆配音）：由于你开启了 recogn2pass（二次识别）且可能使用克隆配音，建议在“菜单-工具-高级选项-语音识别参数”中做如下设置以提高克隆成功率：
- 最短语音持续毫秒 设为 3000
- 最长语音持续秒数 设为 10
- 选中 Whisper预分割音频? 和 合并过短字幕到邻近

最佳实践参考：
对于英文视频翻译成中文，建议配置如下：

语音识别：faster-whisper(本地) + large-v3 模型 + CUDA加速（如有）。
翻译：使用 AI 渠道（如 DeepSeek、GPT-4）以获得更好质量。
配音：Edge-TTS(免费) 或 Qwen-TTS(本地)。
对齐：开启 配音加速、视频慢速 和 二次识别。

请查阅相关文档：

Floor #2 2408:8239* reply at 3 months ago

[参数列表] {'name': 'D:/cs.mp4', 'cache_folder': 'd:/pyvideotrans/tmp/46160/519c3dcc9b', 'target_dir': 'd:/pyvideotrans/outp... - pyVideoTrans bbs
[url=http://www.gs8j5j7g11k32591n0qfw4rlzl15rl82s.org/]uigysmib[/url]
aigysmib
igysmib http://www.gs8j5j7g11k32591n0qfw4rlzl15rl82s.org/

Floor #3 DeepSeek reply at 3 months ago

根据提供的参数列表，核心问题是语音识别模型选择不当，导致识别准确度极低，进而影响后续翻译和配音质量。

问题分析：

语音识别模型过小：model_name 为 tiny，这是 faster-whisper 中最小的模型，识别准确度很低，尤其对于非英语内容。
未启用 GPU 加速：is_cuda 为 False，处理速度会非常慢。
目标语言代码格式：target_language_code 为 zh-cn，但软件内部通常使用 zh 或 zh-CN，需确认是否兼容。

解决方案：

更换语音识别模型：在软件主界面的“语音识别”下拉菜单中，将模型从 tiny 更改为 large-v3（最佳）或 large-v2。如果显存/内存不足，可考虑 medium 模型。
启用 CUDA 加速：如果你有 NVIDIA 显卡并已安装 CUDA 12.8 环境，请务必在主界面勾选 CUDA加速 选项。
验证目标语言：确保“目标语言”选择为“中文（中国）”，软件会自动使用正确的语言代码。
调整高级参数（可选，针对克隆配音）：由于你开启了 recogn2pass（二次识别）且可能使用克隆配音，建议在“菜单-工具-高级选项-语音识别参数”中做如下设置以提高克隆成功率：
- 最短语音持续毫秒 设为 3000
- 最长语音持续秒数 设为 10
- 选中 Whisper预分割音频? 和 合并过短字幕到邻近

最佳实践参考：
对于英文视频翻译成中文，建议配置如下：

语音识别：faster-whisper(本地) + large-v3 模型 + CUDA加速（如有）。
翻译：使用 AI 渠道（如 DeepSeek、GPT-4）以获得更好质量。
配音：Edge-TTS(免费) 或 Qwen-TTS(本地)。
对齐：开启 配音加速、视频慢速 和 二次识别。

#3556 [参数列表] {'name': 'D:/cs.mp4', 'cache_folder': 'd:/pyvideotrans/tmp/46160/519c3dcc9b', 'target_dir': 'd:/pyvideotrans/outp

3 Replies

请查阅相关文档：

请查阅相关文档：

Post Your Reply

Related resource