#4960 videotrans.configure.excepts.DubbingSrtError: Parameter `emo_control_method` is not a valid key-word argument. Please cl

104.160* Posted at: 1 hour ago

Parameter emo_control_method is not a valid key-word argument. Please click on 'view API' in the footer of the Gradio app to see usage.:
Traceback (most recent call last):
File "videotrans\util\ListenVoice.py", line 16, in run
File "videotrans\tts\__init__.py", line 184, in run
File "videotrans\tts\_base.py", line 134, in run
videotrans.configure.excepts.DubbingSrtError: Parameter emo_control_method is not a valid key-word argument. Please click on 'view API' in the footer of the Gradio app to see usage.


=
system:Windows-10-10.0.19045-SP0
version:v4.01
frozen:True
language:zh
root_dir:D:/BaiduNetdiskDownload/win-pyvideotrans-v4.01-0602

23 Replies

你遇到的错误是因为调用了 GPT-SoVITS 配音服务时传入了不支持的参数 emo_control_method,通常是因为 pyVideoTrans 中的 GPT-SoVITS 设置与当前运行的 GPT-SoVITS 服务版本不匹配。

解决方法

  1. 打开 pyVideoTrans,点击顶部菜单栏 TTS设置GPT-SoVITS
  2. 在设置面板中,找到 api_v2 复选框。
  3. 根据你当前运行的 GPT-SoVITS 服务版本:

    • 如果使用的是 GPT-SoVITS v2 版本,请勾选 api_v2
    • 如果使用的是 GPT-SoVITS v1 版本,请取消勾选 api_v2
  4. 确认 API 地址和端口号(例如 http://127.0.0.1:9880)填写正确,然后保存设置并重新尝试。

如果问题仍然存在,请检查 GPT-SoVITS 服务端是否正常启动,或尝试升级 GPT-SoVITS / pyVideoTrans 到最新版。

请查阅相关文档:

Test Ok 这样是提示成功了吗

Test Ok 表示配置成功,服务连接正常。你可以正常使用该 GPT-SoVITS 渠道进行配音了。

如果后续配音时依然出现 emo_control_method 报错,请检查 TTS 设置中 api_v2 复选框的勾选状态是否与你部署的 GPT-SoVITS 版本一致(v2 勾选,v1 不勾选)。

我选的是V1 这两个版本有什么不同

GPT-SoVITS 的 V1 和 V2 是 GPT-SoVITS 项目两个不同的版本分支,主要区别在于 API 接口参数和功能支持不同(例如情感控制参数、声音克隆效果等)。pyVideoTrans 内部通过 api_v2 复选框来适配这两种版本的 API 调用方式,但具体的功能差异超出了本软件核心知识库的覆盖范围。

建议您查阅 GPT-SoVITS 官方文档或项目介绍页面了解具体区别。

请查阅相关文档:

现在怎么克隆我的音频

要将你自己的音频作为参考音色进行克隆,请按以下步骤操作(适用于 GPT-SoVITS V1):

  1. 准备参考音频

    • 录制或截取一段 3~10 秒 的清晰人声,保存为 WAV 格式(建议 16kHz 或 44.1kHz,单声道,无背景噪声)。
    • 文件名使用简短英文数字(例如 myvoice.wav)。
  2. 放置到 GPT-SoVITS 工具根目录

    • 将参考音频文件复制到 GPT-SoVITS 服务程序所在文件夹的根目录(不是 pyVideoTrans 的目录)。
  3. 在 pyVideoTrans 中填写参考音频

    • 打开菜单栏 → TTS设置GPT-SoVITS
    • 在设置界面中的“参考音频”文本框内,输入刚才的文件名(含扩展名,例如 myvoice.wav)。
    • 确保 不勾选 api_v2(因为你是 V1 版本)。
    • 点击保存。
  4. 开始配音时选择该角色

    • 回到主界面,选择 配音渠道GPT-SoVITS
    • 配音角色 下拉框中,你应该能看到新出现的 myvoice.wav 选项,选中它。
    • 其他参数(目标语言、翻译渠道等)按正常流程设置,然后点击开始执行。
注意:若你的目的是克隆原视频中说话人的音色(而非自己的音频),请在配音角色中选择 clone,软件会自动从原视频中截取对应片段作为参考,不需要手动放置音频文件。但需在高级选项中适当调整最短/最长语音时长(建议最短 3000ms,最长 6-10s),并确保 Whisper预分割音频? 选中。

如果需要更详细的配置说明,请查阅相关文档。

请查阅相关文档:

我的是ndex-TTS URL
http://127.0.0.1:7860/V1

明白了,您使用的是 Index-TTS 服务,URL 为 http://127.0.0.1:7860/V1。要在 Index-TTS 中使用您自己的音频进行克隆,请按以下步骤操作:1. 准备参考音频:录制或截取一段 3~10 秒 的清晰人声 WAV 文件(单声道,无噪声),命名为简短英文数字(例如 myvoice.wav)。2. 放置到软件目录:将该 WAV 文件复制到 pyVideoTrans 软件根目录下的 f5-tts/ 文件夹中(如果该文件夹不存在,请手动创建)。3. 在软件中配置:打开 pyVideoTrans → 菜单栏 → TTS设置 → F5-TTS(Index-TTS 也在此设置面板)。在“参考音频”文本框中,输入文件名(含后缀,例如 myvoice.wav)。确认 URL 为 http://127.0.0.1:7860/V1(保持原样)。点击保存。4. 开始配音时选择角色:回到主界面,配音渠道选择 Index-TTS,在配音角色下拉框中选中 myvoice.wav。然后正常设置其他参数(目标语言、翻译等),点击开始执行即可。请查阅相关文档:F5/Spark/Index/VoxCPM/Dia-TTS 配音渠道配置

None:
Traceback (most recent call last):
FilevideotransutilListenVoice.py.line16,in rn
File"videotrans(ttsinit_py".line 184.in run
File"videotrans(ttsbase.py",line 134,in run
videotrans.configure.excepts.DubbingSrtError: None 什么原因

该报错(DubbingSrtError: None)表示配音试听时 Index-TTS 服务返回了空结果或无具体错误信息,常见原因及解决方法如下:

  1. Index-TTS 服务未正常运行
    请确认启动 Index-TTS 的终端窗口是否保持打开状态,且没有报错退出。
  2. URL 配置不匹配
    通常 Index-TTS 的 API 地址默认为 http://127.0.0.1:7860(不带 /V1)。请检查你的服务实际使用的端口和路径,并在 pyVideoTrans 的 菜单 → TTS设置 → F5-TTS 中填写正确的 URL。如果服务要求 /V1 则保留,但多数情况下不需要。
  3. 参考音频文件问题
    确保参考音频已放置在软件根目录下的 f5-tts/ 文件夹中,并且文件名与你在设置中填写的一致(含 .wav 后缀)。音频格式必须为 WAV,时长 3-10 秒,单声道清晰人声。
  4. 网络或依赖问题
    尝试在浏览器中直接访问 http://127.0.0.1:7860(或加 /V1)打开 Index-TTS 的 WebUI,手动输入文本测试 TTS 功能是否正常。
  5. 查看详细日志
    请打开软件根目录下的 logs/ 文件夹,找到最新日志文件,复制底部约 30 行报错信息,以便进一步定位原因。

请按上述顺序排查,多数情况可通过检查服务运行状态和 URL 解决。

2026-06-04 22:42:39,474 WETEXT INFO D:\BaiduNetdisk


\index-tts\index-tts\indextts\utils\tagger_cache\zh_tn_verbalizer.fst
2026-06-04 22:42:39,475 WETEXT INFO skip building fst for zh_normalizer ...
2026-06-04 22:42:39,829 WETEXT INFO found existing fst: D:\BaiduNetdisk
\index-tts\index-tts\wzf\lib\site-packages\tn\en_tn_tagger.fst
2026-06-04 22:42:39,829 WETEXT INFO D:\BaiduNetdisk
\index-tts\index-tts\wzf\lib\site-packages\tn\en_tn_verbalizer.fst
2026-06-04 22:42:39,830 WETEXT INFO skip building fst for en_normalizer ...

TextNormalizer loaded
bpe model loaded from: checkpoints\bpe.model
  • Running on local URL: http://127.0.0.1:7860
  • To create a public link, set share=True in launch().

    start inference...
    Reference audio length: 9.64 seconds
    gpt_gen_time: 2.86 seconds
    gpt_forward_time: 0.03 seconds
    bigvgan_time: 0.30 seconds
    Total inference time: 3.32 seconds
    Generated audio length: 4.52 seconds
    RTF: 0.7337
    wav file saved to: outputs\spk_1780585051.wav
    start inference...
    Reference audio length: 13.69 seconds
    gpt_gen_time: 1.86 seconds
    gpt_forward_time: 0.03 seconds
    bigvgan_time: 0.10 seconds
    Total inference time: 2.06 seconds
    Generated audio length: 3.84 seconds
    RTF: 0.5354
    wav file saved to: outputs\spk_1780587041.wav

根据你提供的 Index-TTS 服务日志,服务本身正常运行,两次推理也都成功生成音频文件(wav file saved to: outputs\spk_1780585051.wav)。但 pyVideoTrans 仍然报 DubbingSrtError: None,原因是 URL 地址不匹配。修复方法:1. 打开 pyVideoTrans → 菜单 → TTS设置 → F5-TTS(Index-TTS 设置面板)。2. 将 URL 修改为 http://127.0.0.1:7860(删除末尾的 /V1)。你的服务日志显示它启动在 http://127.0.0.1:7860,没有 /V1 路径。3. 确保参考音频文件名(myvoice.wav 或其他)与面板中填写的一致,且文件位于 pyVideoTrans/f5-tts/ 目录下。4. 保存设置后重新试听或执行翻译。如果问题依旧,请提供 pyVideoTrans 软件根目录下 logs/ 文件夹里最新日志文件(底部约 30 行),以便进一步排查。

这个tts配音很忙怎么调?

你遇到的“TTS配音很忙”通常是因为并发请求过高导致服务响应缓慢或限流。请按以下步骤调整:1. 打开顶部菜单 → 工具/选项 → 高级选项。2. 在中间的 字幕配音调整 区域中找到以下两项并进行修改:并发配音线程数:将默认值改为 1(限制同时请求的数量,减少服务压力)。配音后暂停秒:设为 5 或 10(每次配音后等待指定秒数再发起下一次请求,防止被限流)。3. 如果是 Edge-TTS(免费在线)渠道,还需进一步在同一个区域找到 EdgeTTS配音渠道配音并发数,也设为 1。4. 点击保存,重新执行任务。如果调整后依然报错“很忙”,请检查 Index-TTS 服务是否正常(终端窗口是否保持打开),并尝试降低目标语言或简化配音文本。

这个tts配音很慢怎么慢是怎么回事。比另外的tts,慢很多

Index-TTS 是本地部署的模型,推理速度取决于硬件(尤其是 GPU)和模型大小,比在线免费服务(如 Edge-TTS)慢是正常现象。如果你觉得速度慢,可尝试以下优化:

  1. 确认已启用 GPU 加速
    Index-TTS 服务本身需使用 GPU 才能明显提速。检查你启动 Index-TTS 的终端,确保输出中包含 device: cudaUsing GPU 字样。若仍在使用 CPU,需在 Index-TTS 的启动命令或配置中指定使用 GPU(具体方法请参考 Index-TTS 项目的文档)。
  2. 限制并发请求数
    在 pyVideoTrans 中,打开 菜单 → 工具/选项 → 高级选项 → 字幕配音调整,将 并发配音线程数 设为 1配音后暂停秒 设为 0(本地服务不需要限流等待)。并发数过大会导致服务排队,反而更慢。
  3. 更换更快的配音渠道
    如果对速度要求高,建议使用 Edge-TTS(免费)Qwen-TTS(本地内置),它们比 Index-TTS 快很多。只需要在主界面切换配音渠道为 Edge-TTS,并选择对应角色即可,无需额外配置。
  4. 检查参考音频时长
    过长或过短的参考音频(如超过 10 秒)会显著增加推理时间。建议使用 3~10 秒的 WAV 文件。

请根据以上步骤排查,优先确认 GPU 是否被正确使用。如果仍然很慢,请提供 Index-TTS 服务终端的输出日志(启动时的前几行)以便进一步判断。

我个GPU利用率只有4,显卡好像没有起效果,能加速吗

Index-TTS GPU 利用率仅 4%,说明该服务未正确启用显卡加速,是在使用 CPU 计算。这是导致速度慢的根本原因。解决方法如下:1. 确认显卡是否满足要求:确保你的 NVIDIA 显卡驱动已更新,并已安装 CUDA 12.x 及以上(推荐 12.8)和 cuDNN 9.x。2. 检查 Index-TTS 启动方式:在启动 Index-TTS 的终端窗口中,查看是否有类似 Using CUDA: True 或 Device: cuda 的输出。若显示 Device: cpu,则需要修改启动命令。3. 修改 Index-TTS 启动参数(示例):如果你的 Index-TTS 基于 Gradio 或 CLI,通常可以通过添加 --gpu 或 --device cuda 来启用。具体请查阅 Index-TTS 项目文档。例如:python app.py --device cuda # 假使启动脚本支持该参数或者设置环境变量:set CUDA_VISIBLE_DEVICES=0(Windows)或 export CUDA_VISIBLE_DEVICES=0(Linux/Mac)4. 重新启动服务:确保服务终端明确显示 GPU 已加载(如 device='cuda'),然后再次在 pyVideoTrans 中尝试。如果仍无法启用 GPU,或因版本兼容问题无法解决,建议直接使用其他配音渠道,例如:Edge-TTS(免费、极快)Qwen-TTS(本地内置,支持 GPU 加速)这些渠道在 pyVideoTrans 中开箱即用,速度远快于陷于 CPU 的 Index-TTS。

F5会不会比indtts快

F5-TTS 通常比 Index-TTS 轻量,推理速度可能更快,但前提是必须正确启用 GPU 加速。如果 Index-TTS 因 GPU 配置问题只能以 CPU 运行,速度会很慢;而 F5-TTS 同样需要依赖本地 GPU 才能发挥性能。建议:1. 先排查当前 Index-TTS 的 GPU 问题(参考上一条回答),确保其正确使用显卡。2. 如果无法解决,可以切换到 F5-TTS 试试(配置方法与 Index-TTS 相同,设置入口在 菜单→TTS设置→F5-TTS,URL 填写你的 F5-TTS 服务地址)。速度取决于你的硬件,但若仍然使用 CPU 则不会有明显改善。3. 若仍不满意速度,强烈推荐切换为 Edge-TTS(免费在线)Qwen-TTS(本地内置),它们开箱即用且速度极快,无需额外部署。

我的显卡是4060

你的显卡是 NVIDIA RTX 4060,本身完全支持 CUDA 加速。之前 GPU 利用率只有 4%,说明 Index-TTS 服务仍然跑在 CPU 上。下面是让 Index-TTS 正确使用显卡的步骤:1. 确认 CUDA 环境已正确安装

  • 在命令提示符(CMD)中输入 nvcc -V,如果显示版本号(12.x 以上)则 CUDA 工具链正常。
  • 输入 nvidia-smi,查看驱动支持的最高 CUDA 版本(应 ≥ 12.8)。
  • 如果缺少 CUDA 或版本过低,请先安装 CUDA 12.8+ 和 cuDNN 9.x。2. 检查 Index-TTS 启动日志
    启动 Index-TTS 后,观察终端输出是否有类似 Device: cudaUsing CUDA: True。如果显示 Device: cpu,则需要修改启动参数。3. 强制指定使用 GPU
    在启动 Index-TTS 的命令中尝试添加 --device cuda 参数。例如(具体以你的启动脚本为准):

    python app.py --device cuda

    或者设置环境变量:
    Windows CMD: set CUDA_VISIBLE_DEVICES=0 后再启动服务。
    PowerShell: $env:CUDA_VISIBLE_DEVICES=0
    重新启动后观察终端是否输出 device='cuda',且 GPU 利用率会明显上升。4. 验证效果
    在 pyVideoTrans 中重新试听或执行任务,检查速度是否提升。如果依然无效,可能是 Index-TTS 项目本身对 CUDA 的支持有 bug 或依赖未正确安装(如 pytorch 版本不是 CUDA 版)。此时建议切换为更轻量的配音渠道:

  • F5-TTS:配置方法与 Index-TTS 相同,但某些版本对 GPU 支持更好,可尝试。
  • Edge-TTS(免费在线)或 Qwen-TTS(本地内置):无需 GPU 加速也能极快响应,开箱即用。

如果仍需排查请提供 Index-TTS 启动时的完整终端输出(前几行包含环境检测的部分)。

请查阅相关文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update. Dondate: ko-fi.com/jianchang512

Related resource