#3473 翻译视频或音频中怎样选择qwen3的base 和clone模型,在哪里选,我要保持音色与原视频一致是需要选clone模型吗?为什么下载qwen3需要这么久,几十分钟进度条都不到1%

205.198* Posted at: 5 hours ago 👁18

翻译视频或音频中怎样选择qwen3的base 和clone模型,在哪里选,我要保持音色与原视频一致是需要选clone模型吗?为什么下载qwen3需要这么久,几十分钟进度条都不到1%

3 Replies

选择 Qwen3 模型(包括 base 和 clone)是在“配音渠道”行进行设置。要保持音色与原视频一致,必须选择 clone 角色,并确保已正确配置 Qwen-TTS 服务。

具体操作步骤:

  1. 选择配音渠道:在主界面“配音渠道”行,选择 Qwen-TTS(本地)Qwen-TTS(bailian)
  2. 选择角色:在“配音角色”下拉菜单中,选择 clone。这表示将克隆原视频的音色进行配音。
  3. 关键前置步骤:使用 clone 角色前,必须在“设置更多参数”中勾选 分离人声背景声。因为克隆需要纯净的人声片段作为参考音频。
  4. 高级设置:进入 菜单-工具-高级选项-语音识别参数,将 最短语音持续毫秒 设为 3000最长语音持续秒数 设为 10。同时勾选 Whisper预分割音频合并过短字幕到相邻。这是为了确保提供给克隆模型的参考音频时长在 3-10 秒的最佳范围内。

关于 Qwen3 模型下载缓慢的问题:
下载进度条长时间卡住(几十分钟不到1%)通常是由于网络连接问题,因为模型需要从 HuggingFace 或其镜像站下载,国内网络访问不稳定。

解决方案:

  1. 配置网络代理:在软件设置中配置可用的网络代理,这是最直接的解决方法。
  2. 手动下载模型:如果代理无效,需手动下载模型文件。

    • 对于 Qwen-TTS 模型:你需要根据软件提示或日志中的模型名称,前往 HuggingFace 网站(如 https://huggingface.co/Qwen)或国内镜像站找到对应模型仓库,手动下载所有 .bin.json.txt 等文件。
    • 存放位置:将下载的文件放入软件根目录下的 models 文件夹中,并确保文件夹命名与软件期望的完全一致(通常类似 models--Qwen--Qwen2.5-Audio-TTS 的格式)。具体文件夹命名规则请参考日志或错误提示。

请查阅相关文档:

出错了,可能内存或显存不足
A process in the process pool was terminated abruptly while the future was running or pending.:
Traceback (most recent call last):
File "videotrans\configure\_base.py", line 284, in _new_process
File "concurrent\futures\_base.py", line 458, in result
File "concurrent\futures\_base.py", line 403, in __get_result
File "videotrans\configure\_base.py", line 284, in _new_process
File "concurrent\futures\_base.py", line 458, in result
File "concurrent\futures\_base.py", line 403, in __get_result
concurrent.futures.process.BrokenProcessPool: A process in the process pool was terminated abruptly while the future was running or pending.

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
File "videotrans\util\ListenVoice.py", line 16, in run
File "videotrans\tts\__init__.py", line 346, in run
File "videotrans\tts\_base.py", line 136, in run
File "videotrans\tts\_qwenttslocal.py", line 53, in _exec
File "videotrans\configure\_base.py", line 294, in _new_process
RuntimeError: 出错了,可能内存或显存不足
A process in the process pool was terminated abruptly while the future was running or pending.

此错误是由于在运行 Qwen-TTS 本地模型时,系统内存或显存不足,导致工作进程被强制终止。

解决方案:

  1. 降低资源占用

    • 进入 菜单 -> 工具 -> 高级选项
    • 【通用设置】 区域,将 GPU同时任务数[重启生效] 设置为 1
    • 【字幕配音调整】 区域,将 并发配音线程数 设置为 1
    • 修改后,关闭并重启软件 以使设置生效。
  2. 检查并优化 Qwen-TTS 模型使用

    • 确保你使用的是适合你硬件配置的 Qwen-TTS 模型版本。如果显存小于 8GB,运行大模型可能非常吃力。
    • 如果正在进行 语音克隆 (clone),请确认已按照前述步骤正确设置了 分离人声背景声 以及调整了语音识别参数(最短语音 3000ms,最长语音 10s),以避免处理异常时长的音频片段。
  3. 监控资源使用

    • 在任务运行时,打开系统任务管理器,观察 内存GPU 显存 的使用情况。如果接近或达到 100%,则证实是资源瓶颈。
  4. 备选方案

    • 如果硬件资源确实有限,考虑使用对资源要求更低的配音渠道,例如 Edge-TTS(完全免费,资源消耗极低)。
    • 或者,使用在线的 Qwen-TTS(bailian) 渠道,将计算负载转移到云端。

如果以上调整后问题依旧,请提供软件 logs 目录下最新的日志文件内容(底部约30行),以便进一步分析。

请查阅相关文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource