#3473 翻译视频或音频中怎样选择qwen3的base 和clone模型，在哪里选，我要保持音色与原视频一致是需要选clone模型吗？为什么下载qwen3需要这么久，几十分钟进度条都不到1%

205.198* Posted at: 4 months ago

翻译视频或音频中怎样选择qwen3的base 和clone模型，在哪里选，我要保持音色与原视频一致是需要选clone模型吗？为什么下载qwen3需要这么久，几十分钟进度条都不到1%

Floor #1 DeepSeek reply at 4 months ago

选择 Qwen3 模型（包括 base 和 clone）是在“配音渠道”行进行设置。要保持音色与原视频一致，必须选择 clone 角色，并确保已正确配置 Qwen-TTS 服务。

具体操作步骤：

选择配音渠道：在主界面“配音渠道”行，选择 Qwen-TTS(本地) 或 Qwen-TTS(bailian)。
选择角色：在“配音角色”下拉菜单中，选择 clone。这表示将克隆原视频的音色进行配音。
关键前置步骤：使用 clone 角色前，必须在“设置更多参数”中勾选 分离人声背景声。因为克隆需要纯净的人声片段作为参考音频。
高级设置：进入 菜单-工具-高级选项-语音识别参数，将 最短语音持续毫秒 设为 3000，最长语音持续秒数 设为 10。同时勾选 Whisper预分割音频 和 合并过短字幕到相邻。这是为了确保提供给克隆模型的参考音频时长在 3-10 秒的最佳范围内。

关于 Qwen3 模型下载缓慢的问题：
下载进度条长时间卡住（几十分钟不到1%）通常是由于网络连接问题，因为模型需要从 HuggingFace 或其镜像站下载，国内网络访问不稳定。

解决方案：

配置网络代理：在软件设置中配置可用的网络代理，这是最直接的解决方法。
手动下载模型：如果代理无效，需手动下载模型文件。
- 对于 Qwen-TTS 模型：你需要根据软件提示或日志中的模型名称，前往 HuggingFace 网站（如 https://huggingface.co/Qwen）或国内镜像站找到对应模型仓库，手动下载所有 .bin、.json、.txt 等文件。
- 存放位置：将下载的文件放入软件根目录下的 models 文件夹中，并确保文件夹命名与软件期望的完全一致（通常类似 models--Qwen--Qwen2.5-Audio-TTS 的格式）。具体文件夹命名规则请参考日志或错误提示。

请查阅相关文档：

Floor #2 156.229* reply at 4 months ago

出错了，可能内存或显存不足
A process in the process pool was terminated abruptly while the future was running or pending.:
Traceback (most recent call last):
File "videotrans\configure\_base.py", line 284, in _new_process
File "concurrent\futures\_base.py", line 458, in result
File "concurrent\futures\_base.py", line 403, in __get_result
File "videotrans\configure\_base.py", line 284, in _new_process
File "concurrent\futures\_base.py", line 458, in result
File "concurrent\futures\_base.py", line 403, in __get_result
concurrent.futures.process.BrokenProcessPool: A process in the process pool was terminated abruptly while the future was running or pending.

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
File "videotrans\util\ListenVoice.py", line 16, in run
File "videotrans\tts\__init__.py", line 346, in run
File "videotrans\tts\_base.py", line 136, in run
File "videotrans\tts\_qwenttslocal.py", line 53, in _exec
File "videotrans\configure\_base.py", line 294, in _new_process
RuntimeError: 出错了，可能内存或显存不足
A process in the process pool was terminated abruptly while the future was running or pending.

Floor #3 DeepSeek reply at 4 months ago

此错误是由于在运行 Qwen-TTS 本地模型时，系统内存或显存不足，导致工作进程被强制终止。

解决方案：

降低资源占用：
- 进入 菜单 -> 工具 -> 高级选项。
- 在 【通用设置】 区域，将 GPU同时任务数[重启生效] 设置为 1。
- 在 【字幕配音调整】 区域，将 并发配音线程数 设置为 1。
- 修改后，关闭并重启软件 以使设置生效。
检查并优化 Qwen-TTS 模型使用：
- 确保你使用的是适合你硬件配置的 Qwen-TTS 模型版本。如果显存小于 8GB，运行大模型可能非常吃力。
- 如果正在进行 语音克隆 (clone)，请确认已按照前述步骤正确设置了 分离人声背景声 以及调整了语音识别参数（最短语音 3000ms，最长语音 10s），以避免处理异常时长的音频片段。
监控资源使用：
- 在任务运行时，打开系统任务管理器，观察内存和 GPU 显存 的使用情况。如果接近或达到 100%，则证实是资源瓶颈。
备选方案：
- 如果硬件资源确实有限，考虑使用对资源要求更低的配音渠道，例如 Edge-TTS（完全免费，资源消耗极低）。
- 或者，使用在线的 Qwen-TTS(bailian) 渠道，将计算负载转移到云端。

如果以上调整后问题依旧，请提供软件 logs 目录下最新的日志文件内容（底部约30行），以便进一步分析。

#3473 翻译视频或音频中怎样选择qwen3的base 和clone模型，在哪里选，我要保持音色与原视频一致是需要选clone模型吗？为什么下载qwen3需要这么久，几十分钟进度条都不到1%

3 Replies

请查阅相关文档：

请查阅相关文档：

Post Your Reply

Related resource