Page 26 BBS.pyVideoTrans.com TaskCfgVTT(uuid='7798cb1b90', name='E:/33/Someones Assassinating Putins Inner Circle.mp4', dirname='E:/33', noextname='Someones Assassinating Putins Inner Circle', basename='Someones Assassinating Putins Inner Circle.mp4', ext='mp4', target_dir='E:/33/_video_out/Someones Assassinating Putins Inner Circle-mp4', cache_folder='E:/A4/tmp/38208/7798cb1b90', is_cuda=True, source_language='英语', source_language_code='en', source_sub='E:/33/_video_out/Someones Assassinating Putins Inner Circle-mp4/en.srt', source_wav='E:/A4/tmp/38208/7798cb1b90/remove_noise.wav', source_wav_output='E:/33/_video_out/Someones Assassinating Putins Inner Circle-mp4/en.m4a', target_language='简体中文', target_language_code='zh-cn', target_sub='E:/33/_video_out/Someones Assassinating Putins Inner Circle-mp4/zh-cn.srt', target_wav='E:/A4/tmp/38208/7798cb1b90/target.wav', target_wav_output='E:/33/_video_out/Someones Assassinating Putins Inner Circle-mp4/zh-cn.m4a', translate_type=8, tts_type=1, volume='+0%', pitch='+0Hz', voice_rate='+0%', voice_role='clone', voice_autorate=False, video_autorate=False, remove_silent_mid=False, align_sub_audio=True, detect_language='en', recogn_type=1, model_name='large-v3', shibie_audio=None, remove_noise=True, enable_diariz=False, nums_diariz=0, rephrase=0, fix_punc=0, subtitle_language=None, app_mode='biaozhun', subtitles='', targetdir_mp4='E:/33/_video_out/Someones Assassinating Putins Inner Circle-mp4/Someones Assassinating Putins Inner Circle.mp4', novoice_mp4='E:/A4/tmp/38208/7798cb1b90/novoice.mp4', is_separate=False, embed_bgm=True, instrument='E:/A4/tmp/38208/7798cb1b90/instrument.wav', vocal='E:/A4/tmp/38208/7798cb1b90/vocal.wav', clear_cache=False, background_music='', subtitle_type=0, only_out_mp4=False, recogn2pass=False, output_srt=0, copysrt_rawvideo=False, loop_backaudio=1, backaudio_volume=0.8)

#5288 TaskCfgVTT(uuid='7798cb1b90', name='E:/33/Someones Assassinating Putins Inner Circle.mp4', dirname='E:/33', noextname='Someones Assassinating Putins Inner Circle', basename='Someon...

[Last reply:26 days ago] 这是 openai-whisper 模型的本地缓存文件损坏（SHA256 校验不匹配）导致加载失败。请按以下步骤修复：找到软件安装目录（E:/A4）下的 models 文件夹。删除 models 文件夹内所有名称包含 openai/whisper-large-v3 或 whisper-large-v3 的子文件夹及文件（例如 models--openai--whisper-large-v3）。重...

2a09:bac5* Posted at: 26 days ago

#5287 videotrans.configure.excepts.DubbingSrtError: Value: 'Same as the voice reference' (type: <class 'str'>) is not in the list of choices: ['Same as the voice referenc', '使用情感参考音频', '...

💬 1

[Last reply:26 days ago] 这是 index-tts 开源库内部多语言界面字符翻译不一致导致的校验 Bug。解决方案：找到您本地部署的 index-tts 项目根目录下的 webui.py 文件。全局搜索字符串 i18n("与音色参考音频相同")，将其替换为英文：Same as the voice reference，保存文件。重启 index-tts 服务即可。如果仍然报错，请检查 webui.py 中...

23.95* Posted at: 26 days ago

#5286 TaskCfgVTT(uuid='2d58939cdd', name='E:/videoplayback.m4a', dirname='E:/', noextname='videoplayback', basename='videoplayback.m4a', ext='m4a', target_dir='E:/_video_out/videoplaybac...

💬 1

[Last reply:26 days ago] 该错误是因为 Qwen-ASR(本地) 模型在处理音频时，VAD（语音活动检测）分割后未提取到有效语音上下文，通常由音频过短、静音或噪声导致。解决方案：检查音频时长：确认 E:/videoplayback.m4a 是否包含清晰的人类语音、时长是否大于1秒。更换 ASR 渠道：推荐换用 faster-whisper(本地) 或 openai-whisper(本地)，它们对短音频和噪声的鲁棒性更好。调...

2a09:bac5* Posted at: 26 days ago

#5285 videotrans.configure.excepts.DubbingSrtError: Value: 'Same as the voice reference' (type: <class 'str'>) is not in the list of choices: ['与音色参考音频相同', '使用情感参考音频', '使用情感向量控制', '使用情感描...

💬 1

[Last reply:26 days ago] 这是由于 index-tts 内部语言翻译字符串不一致导致的校验错误。请按以下步骤修复：找到你本地部署的 index-tts 项目根目录下的 webui.py 文件。用文本编辑器打开，全局搜索字符串 i18n("与音色参考音频相同")。将其直接替换为英文："Same as the voice reference"。保存文件，重新启动 index-tts 服务...

23.95* Posted at: 26 days ago

#5284 moss-tts-nano只有cpu再跑gpu没动静...

💬 8

[Last reply:26 days ago] 正常。这个渠道是使用onnxruntime运行的，仅包含cpu运行时，不使用gpu...

147.45* Posted at: 26 days ago

#5283 TaskCfgVTT(uuid='2d58939cdd', name='E:/videoplayback.m4a', dirname='E:/', noextname='videoplayback', basename='videoplayback.m4a', ext='m4a', target_dir='E:/_video_out/videoplaybac...

💬 1

[Last reply:26 days ago] Qwen-ASR(本地内置) 返回 Batch size mismatch: audio=8, context=0 错误，原因是模型在识别的子进程中拿到了音频片段（batch 数为 8），但上下文信息（context）为空，导致数据对不齐。这通常是因为语音预分割或 VAD 参数设置不当，使得截取的音频片段无法关联到有效的识别上下文，或者模型加载时缓存了不完整的状态。排查步骤（请按顺序尝试）：关闭...

2a09:bac5* Posted at: 26 days ago

#5282 videotrans.configure.excepts.DubbingSrtError: Cannot find a function with `api_name`: /generate....

💬 1

[Last reply:26 days ago] 这个错误通常是因为您使用的 TTS 配音渠道（如 ChatTTS、Fish-TTS 等基于 Gradio 的本地部署服务）没有正确运行，或者 API 地址/端口配置错误导致的。/generate 一般是 ChatTTS-UI 的 Gradio 接口端点。请按以下步骤排查：确认配音渠道打开软件主界面，查看当前选择的配音渠道是哪一项。如果选择了 ChatTTS、Fish-TTS 或 Kokor...

2a09:bac5* Posted at: 26 days ago

#5281 videotrans.configure.excepts.DubbingSrtError: Cannot find a function with `api_name`: /generate....

💬 1

[Last reply:26 days ago] 这个错误是因为配音渠道选择了本地部署的TTS服务（如GPT-SoVITS），但API无法找到 /generate 端点。这表明服务未正确启动或API地址配置有误。解决方法：检查TTS服务是否运行：如果使用 GPT-SoVITS，请确保已启动其 api.py 或 api_v2.py 脚本，并且终端窗口保持打开状态（无报错退出）。核对API地址：打开软件菜单 → TTS设置 → 对应渠道（如 ...

2a09:bac5* Posted at: 26 days ago

#5280 TaskCfgVTT(uuid='a94834c904', name='F:/Tutorial/CA-CClassDevelopment2023-10/CA-CClassDevelopment2023-10/01_abstraction-and-console-app-classes/01_getting-started/02_navigating-a-co...

💬 1

[Last reply:26 days ago] 这是由于视频慢速处理时，系统无法正确获取 CPU 核心数，导致创建的进程池工作线程数为 0。解决方法（任选其一）：关闭“视频慢速”：在主界面“同步对齐”行，取消勾选“视频慢速”，仅使用“音频加速”对齐。这是最快方案。手动设置 CPU 并发数：点击菜单工具 → 高级选项 → 通用设置，找到 “CPU同时任务数[重启生效]”，将其改为一个固定值（如 4），然后重启软件。检查系统环境：确保没有系统级限...

147.45* Posted at: 26 days ago

#5279 videotrans.configure.excepts.DubbingSrtError: Value: 'Same as the voice reference' (type: <class 'str'>) is not in the list of choices: ['与音色参考音频相同', '使用情感参考音频', '使用情感向量控制', '使用情感描...

💬 1

[Last reply:26 days ago] 这是 index-tts 开源库内部的多语言界面字符翻译不一致引发的校验 Bug。错误提示中 'Same as the voice reference' 是英文选项，但下拉列表中的值是中文「与音色参考音频相同」，导致选择时校验不通过。解决办法：找到你本地部署的 index-tts 项目根目录下的 webui.py 文件（或类似名称的界面配置文件）。全局搜索字符串 i18n(&q...

2a09:bac5* Posted at: 26 days ago

#5278 TaskCfgVTT(uuid='d87b1dd66e', name='D:/win-pyvideotrans-v4.02-0616/myVideo/test.mp4', dirname='D:/win-pyvideotrans-v4.02-0616/myVideo', noextname='test', basename='test.mp4', ext='...

💬 1

[Last reply:26 days ago] 这是 Qwen-ASR 本地模型的一个底层推理报错，常见于模型加载异常或音频处理时上下文信息丢失。请尝试以下步骤：删除模型缓存重新下载关闭软件后，删除 models/ 目录下的 models--Qwen--Qwen3-ASR-... 文件夹（或对应缓存），重启软件，让模型在第一次使用时重新下载。更换语音识别渠道可临时换用 faster-whisper(本地) + large-v3 模型，或...

95.40* Posted at: 26 days ago

#4272 LLM重新断句是什么原理...

💬 9

[Last reply:26 days ago] 是的，F5-TTS 被列为 pyVideoTrans 的推荐配音渠道之一，尤其适合中英日韩语言的配音和声音克隆场景。它属于本地部署型，需要自行搭建服务并配置 API 地址。详见知识库中“最佳配置推荐”配音部分及“支持音色克隆的配音渠道”列表。...

2409:8a55* Posted at: 2 months ago

#5277 翻译后的文本中会出现字样如何去除...

💬 1

[Last reply:26 days ago] 翻译结果中出现 <TRANSLATE_TEXT> 或 </TRANSLATE_TEXT> 是提示词模板格式标记，正常情况下软件会在处理时自动移除。若仍出现，可能是版本 bug 或自定义提示词导致。升级软件：请更新到最新版本 v4.02，此问题已在后续版本修复。恢复默认提示词：若曾修改 videotrans/prompts/srt/ 或 text/ 下的提示词文件，请删除或还...

120.244* Posted at: 26 days ago

#5276 openai.LengthFinishReasonError: Could not parse response content as the length limit was reached - CompletionUsage(completion_tokens=4096, prompt_tokens=2761, total_tokens=6857, co...

💬 1

[Last reply:26 days ago] 这个错误是因为您调用的本地大模型设定了输出最大 token 上限为 4096，而一次性发送的字幕行数过多导致返回内容被截断。解决方案增大模型输出限制：在本地大模型配置界面（菜单→翻译设置→兼容AI/本地模型），将 max_tokens 参数调大，例如设为 8192 或更高，确保模型有足够空间返回完整翻译。减少每批发送的字幕行数：进入高级选项（菜单→工具→高级选项→字幕翻译调整），将 AI翻译渠道每...

120.244* Posted at: 26 days ago

#5275 代理设置不正确或代理不可用，请检查代理或关闭代理并删掉代理文本框中所填内容...

💬 1

[Last reply:26 days ago] 代理设置错误或代理服务器不可用导致网络请求失败。请按以下步骤处理：检查主界面第5行“网络代理”文本框——如果里面填写了代理地址（如 http://127.0.0.1:xxxx），请确认该代理服务是否正在运行，且地址和端口号正确。若使用VPN或代理工具，请确保已开启并监听对应端口；若不需要代理，请完全清空该文本框内的所有内容（不要留空格）。清空后，在菜单工具 -> 高级选项 -> 通用...

31.22* Posted at: 26 days ago

#5274 TaskCfgVTT(is_cuda=False, uuid='d6fd35ea3b', cache_folder='D:/videotrans1/tmp/51264/d6fd35ea3b', target_dir='C:/Users/zwsoft/Desktop/_video_out/WuKong 2027 DEMO-mp4', source_langua...

💬 1

[Last reply:26 days ago] 暂无法确定具体原因。请提供软件安装目录下的 logs/ 文件夹中最新的日志文件（复制底部约30行报错信息）以便分析。...

31.22* Posted at: 26 days ago

#5273 字幕存在断句错误情况上下语句不连贯...

💬 1

[Last reply:26 days ago] 这是 ASR 语音识别后的断句不合理导致的，主要表现为单条字幕过长或语义切点错误。可以用以下两种方式改善：开启 LLM 重新断句在主界面第 2 行语音识别渠道旁，选择“LLM 重新断句”，并确保已配置 DeepSeek 或 OpenAI 等 AI 渠道的 API Key。系统会将识别文本发送给 AI，自动修正错别字并重新切分句子，使上下字幕语义连贯。调整语音识别参数进入菜单 → 工具 →...

2a09:bac1* Posted at: 26 days ago

#4268 音色文件本身是不是也有隐性的温度值？...

💬 11

[Last reply:26 days ago] 您提供的日志显示软件正在执行音频末尾补静音操作，这是音画对齐的一个正常环节：当配音音频实际时长短于字幕标注的时长时，自动将不足的部分用静音填充，以确保字幕与声音在时间轴上一一对应，避免后续字幕提前出现或前后音频重叠。同时日志末尾显示跳过二次识别，表示您未在设置中启用二次识别功能（该功能用于对配音后的音频再次转录以生成更精确的字幕）。整个流程属于标准行为，并无异常。如果您有其他具体疑问（例如这些静音...

2409:8a55* Posted at: 2 months ago

#5272 TaskCfgVTT(uuid='2434f1fe9b', name='C:/Users/zwsoft/Desktop/WuKong 2027 DEMO.mp4', dirname='C:/Users/zwsoft/Desktop', noextname='WuKong 2027 DEMO', basename='WuKong 2027 DEMO.mp4',...

💬 1

[Last reply:26 days ago] 这是由于 Qwen-ASR(本地) 模型在加载上下文（context）时出现异常，常见于模型文件不完整或音频预处理阶段出错。Batch size mismatch: audio=8, context=0 表示 ASR 将音频切分为 8 个片段，但未能正确生成对应的上下文数据。解决方案：强制重新下载模型：删除软件目录/models/ 下的 qwen-asr 相关文件夹，然后重启软件重新执行识别任务...

31.22* Posted at: 26 days ago

#5271 TaskCfgVTT(uuid='6ad3492ec2', name='C:/Users/zwsoft/Desktop/3X Milling Improvements_ENG_Finished.mp4', dirname='C:/Users/zwsoft/Desktop', noextname='3X Milling Improvements_ENG_Fin...

💬 1

[Last reply:26 days ago] 这是 Qwen-ASR 本地模型的内部约束错误——模型收到的音频片段数量（8段）对应的上下文信息为零。通常因为分离出的人声文件(vocal.wav)为空或极短静音，导致模型无法提取有效上下文。请按以下顺序排查：取消勾选“分离人声背景声” 主界面 → “设置更多参数” → 取消分离人声背景声，重新执行。若能通过，则原因为分离所得的人声文件损坏或静音。检查人声文件打开 D:/videotran...

31.22* Posted at: 26 days ago

#5288 TaskCfgVTT(uuid='7798cb1b90', name='E:/33/Someones Assassinating Putins Inner Circle.mp4', dirname='E:/33', noextname='Someones Assassinating Putins Inner Circle', basename='Someon...

#5287 videotrans.configure.excepts.DubbingSrtError: Value: 'Same as the voice reference' (type: <class 'str'>) is not in the list of choices: ['Same as the voice referenc', '使用情感参考音频', '...

#5286 TaskCfgVTT(uuid='2d58939cdd', name='E:/videoplayback.m4a', dirname='E:/', noextname='videoplayback', basename='videoplayback.m4a', ext='m4a', target_dir='E:/_video_out/videoplaybac...

#5285 videotrans.configure.excepts.DubbingSrtError: Value: 'Same as the voice reference' (type: <class 'str'>) is not in the list of choices: ['与音色参考音频相同', '使用情感参考音频', '使用情感向量控制', '使用情感描...

#5284 moss-tts-nano只有cpu再跑gpu没动静...

#5283 TaskCfgVTT(uuid='2d58939cdd', name='E:/videoplayback.m4a', dirname='E:/', noextname='videoplayback', basename='videoplayback.m4a', ext='m4a', target_dir='E:/_video_out/videoplaybac...

#5282 videotrans.configure.excepts.DubbingSrtError: Cannot find a function with `api_name`: /generate....

#5281 videotrans.configure.excepts.DubbingSrtError: Cannot find a function with `api_name`: /generate....

#5280 TaskCfgVTT(uuid='a94834c904', name='F:/Tutorial/CA-CClassDevelopment2023-10/CA-CClassDevelopment2023-10/01_abstraction-and-console-app-classes/01_getting-started/02_navigating-a-co...

#5279 videotrans.configure.excepts.DubbingSrtError: Value: 'Same as the voice reference' (type: <class 'str'>) is not in the list of choices: ['与音色参考音频相同', '使用情感参考音频', '使用情感向量控制', '使用情感描...

#5278 TaskCfgVTT(uuid='d87b1dd66e', name='D:/win-pyvideotrans-v4.02-0616/myVideo/test.mp4', dirname='D:/win-pyvideotrans-v4.02-0616/myVideo', noextname='test', basename='test.mp4', ext='...

#4272 LLM重新断句是什么原理...

#5277 翻译后的文本中会出现字样 如何去除...

#5276 openai.LengthFinishReasonError: Could not parse response content as the length limit was reached - CompletionUsage(completion_tokens=4096, prompt_tokens=2761, total_tokens=6857, co...

#5275 代理设置不正确或代理不可用，请检查代理或关闭代理并删掉代理文本框中所填内容...

#5274 TaskCfgVTT(is_cuda=False, uuid='d6fd35ea3b', cache_folder='D:/videotrans1/tmp/51264/d6fd35ea3b', target_dir='C:/Users/zwsoft/Desktop/_video_out/WuKong 2027 DEMO-mp4', source_langua...

#5273 字幕存在断句错误情况 上下语句不连贯...

#4268 音色文件本身是不是也有隐性的温度值？...

#5272 TaskCfgVTT(uuid='2434f1fe9b', name='C:/Users/zwsoft/Desktop/WuKong 2027 DEMO.mp4', dirname='C:/Users/zwsoft/Desktop', noextname='WuKong 2027 DEMO', basename='WuKong 2027 DEMO.mp4',...

#5271 TaskCfgVTT(uuid='6ad3492ec2', name='C:/Users/zwsoft/Desktop/3X Milling Improvements_ENG_Finished.mp4', dirname='C:/Users/zwsoft/Desktop', noextname='3X Milling Improvements_ENG_Fin...

Related resource

#5277 翻译后的文本中会出现字样如何去除...

#5273 字幕存在断句错误情况上下语句不连贯...