-
#5488 chất lượng video làm sao để giữ nguyên gốc k bị làm mờ làm nhòe đi. mà cũng không làm quá nặng video...
💬 3[Last reply:6 hours ago] 配音音量太小,请按以下步骤调大:在主界面,点击「设置更多参数...」按钮。找到 音量+ 这一项,将默认的 0 改成较大的正值,例如 +50(表示增大 50%)或 +100(增大 100%)。重新执行任务,配音音量会明显变大。若仍觉得小,可尝试同时增大系统的输出音量或检查配音渠道本身的输出特性(如某些 TTS 渠道默认音量较低)。...171.234* Posted at: 6 hours ago -
#5422 videotrans.configure.excepts.VideoTransError: Dubbing failed不存在参考音频,无法克隆:role='NamMinh(Male/VN)',wavfile='C:/Users/admin/Documents/win-pyvideotrans-v4.03-0622/f5-tts/NamMinh(Male/V...
💬 33[Last reply:7 hours ago] chất lượng video làm sao để giữ nguyên gốc k bị làm mờ làm nhòe đi...171.234* Posted at: 2 days ago -
#5487 目标语言中的西班牙语是墨西哥西班牙语还是欧洲西班牙语啊?我的需求是墨西哥西班牙语和巴西葡萄牙语配音都需要,不同地方说的语言会有些差别...
💬 5[Last reply:7 hours ago] 您使用的 v4.03-0622 版本确实默认只显示常见的语言名称(如“西班牙语”、“葡萄牙语”),并没有将每个地区变体(如墨西哥西班牙语、巴西葡萄牙语)单独列出。这是正常的,因为语言列表为了简洁而省略了地区后缀,但软件底层是支持这些地区变体的。您可以通过以下两种方式实现需求:方法一:直接选择对应的配音角色(推荐)在目标语言选择为“西班牙语”或“葡萄牙语”后,配音渠道选择支持地区角色的渠道(如 Ed...14.153* Posted at: 7 hours ago -
#5486 视频自带字幕,或者有字幕文件的怎么克隆音色...
💬 1[Last reply:9 hours ago] 视频自带字幕(硬字幕)软件无法直接提取文本,需要先用OCR工具转成SRT;如果是软字幕可以提取为SRT。 拥有SRT后,按以下步骤利用它进行音色克隆:整理外部字幕将原始视频文件重命名为简短英文名(如 video.mp4)。在该视频同目录下创建 _video_out 文件夹,再在其中创建子文件夹,命名为 video-mp4(格式:文件名-视频格式)。将你的源语言字幕(如中文)复制到该子文件夹,重命...116.172* Posted at: 9 hours ago -
#5485 想要加入小语种怎么办,比如缅甸语之类的...
💬 1[Last reply:12 hours ago] 添加小语种需要修改软件的语言配置和模型支持。由于 pyVideoTrans 是开源的,您可以通过以下步骤实现:确认语言代码:缅甸语的语言代码为 my(语音识别用)和 my-MM(字幕/界面用)。修改语言列表:打开源码目录 videotrans/configure/contants.py,在 LANGUAGE_* 或 SUPPORT_LANGUAGE 等列表中追加 ("my", ...2409:8a20* Posted at: 12 hours ago -
#5484 一个小时的英文讲解视频,通过uv run sp.py方式翻译视频,输出的视频只有24秒。...
💬 1[Last reply:13 hours ago] 根据您的描述,输出视频时长仅24秒(原视频1小时),很可能是因为流水线在某个阶段中断或出错,只处理了开头一小段。常见原因包括:源视频编码特殊:某些非标准编码或损坏的视频开头可解码,后续报错,导致FFmpeg只完成前几秒。ASR未识别出大部分语音:发音语言选择错误、VAD参数过于严格、或模型崩溃,导致只识别出极短片段。任务中途崩溃:显存不足、子进程超时、或第三方API限流,但软件误将部分输出当作最终...220.130* Posted at: 13 hours ago -
#5483 cfg=TaskCfgSTT(uuid='50d0170e4c', name='D:/张建光/姜胡说/2022年/@姜胡说_20220516_看到_打断_重新设计_执行路径_这很高级_姜胡....mp4', dirname='D:/张建光/姜胡说/2022年', noextname='@姜胡说_20220516_看到_打断_重新设计_执行路径_这很高级_姜胡...
💬 1[Last reply:14 hours ago] 这是由于你的显卡显存不足导致的。GPU 0 总容量仅 4GB,当前空闲仅 608 MB,而阿里 FunASR (paraformer-zh) 模型需要额外分配 912 MB,超出了可用范围。解决方案(按推荐顺序尝试):关闭 CUDA 加速,使用 CPU 运行 在主界面取消勾选 “CUDA加速”,再次执行。速度会慢很多,但能避免显存不足。切换为更轻量的本地识别渠道 发音语言为中文时,改用 fas...106.35* Posted at: 14 hours ago -
#5482 cfg=TaskCfgSTT(uuid='68ac55afdf', name='D:/张建光/姜胡说/2021年/@姜胡说_20211024_这是我理解的_蕞简单的投资_姜胡说_打造用的....mp4', dirname='D:/张建光/姜胡说/2021年', noextname='@姜胡说_20211024_这是我理解的_蕞简单的投资_姜胡说_打造用的.....
💬 1[Last reply:15 hours ago] 语音识别阶段出错[阿里FunASR(本地内置)] KeyError: 'sentence_info'原因:FunASR 本地模型在处理该音频时返回的数据结构中缺少 sentence_info 字段,通常因为音频中未检测到有效的人声片段、音频格式不兼容或模型异常导致。解决方案:检查音频质量:确认视频中是否包含清晰连续的人声。若音视频文件本身只有背景音乐或静音,可改用其他测试文件。...106.35* Posted at: 15 hours ago -
#5481 Dubbing failed不存在参考音频,无法克隆:role='Zariyah(Female/SA)',wavfile='D:/Package/win-pyvideotrans-v4.03-0623_20260624_101318/f5-......
💬 1[Last reply:1 day ago] 该错误是因为配音角色 Zariyah(Female/SA) 需要在 f5-tts 文件夹下存在对应的 .wav 参考音频文件,但软件未找到该文件。解决方法步骤:准备一段 5-10 秒、清晰无背景噪声的阿拉伯语说话音频,保存为 .wav 格式,文件名建议为 Zariyah.wav(避免使用括号和空格)。将 Zariyah.wav 文件复制到软件根目录下的 f5-tts 文件夹内(即报错中指出的路径 ...14.155* Posted at: 1 day ago -
#5480 TaskCfg(cache_folder='F:/解说配音软件/tmp/20632/113401d14e', target_dir='F:/解说配音软件/output/recogn', remove_noise=False, is_separate=False, detect_language='es', subtitle_language=None, so...
💬 1[Last reply:1 day ago] 这是网络连接失败导致无法下载 openai-whisper 模型文件(tiny.pt)。首次使用 openai-whisper 时必须从 Hugging Face 或 OpenAI 服务器下载模型,如果你的计算机无法直接访问这些服务器(例如受限网络),就会报 "连接被拒绝"。解决步骤(任选其一)配置网络代理: 在主界面顶部 网络代理 输入框中填写你的代理地址(如 http://127.0.0.1...39.163* Posted at: 1 day ago -
#5479 AttributeError: 'InvalidURL' object has no attribute 'message'...
💬 1[Last reply:1 day ago] 此错误是由于语音识别阶段调用的 API 地址格式错误导致的。日志显示 Invalid URL 'http:/api': No host supplied,表示您在主界面或菜单设置中填写的某个 API 地址缺少了主机部分(如 127.0.0.1 或具体域名)。解决方案:检查代理设置: 确保主界面底部或菜单「工具 → 高级选项 → 通用设置」中的代理文本框格式正确,例如 http...39.163* Posted at: 1 day ago -
#5478 cfg=TaskCfgSTT(uuid='6f1ee0d9fa', name='D:/张建光/姜胡说/2021年/@姜胡说_20201008_我Z核心的底层方法之一_建议多看几遍_刻意练习_值....mp4', dirname='D:/张建光/姜胡说/2021年', noextname='@姜胡说_20201008_我Z核心的底层方法之一_建议多看几遍_刻意...
💬 1[Last reply:1 day ago] 这是典型的显卡显存不足导致的报错。您的 GPU 0 总显存仅 4GB,运行 Qwen-ASR(本地) 模型(即使是 0.6B 小模型)仍超出可用容量,导致 torch.OutOfMemoryError。解决方案(按推荐顺序尝试):换用更轻量的本地语音识别渠道 推荐使用 faster-whisper(本地),并选择 base 或 small 模型(large-v3 同样会爆显存)。在高级选项中关闭...106.35* Posted at: 1 day ago -
#5477 cfg=TaskCfgSTT(uuid='6f1ee0d9fa', name='D:/张建光/姜胡说/2021年/@姜胡说_20201008_我Z核心的底层方法之一_建议多看几遍_刻意练习_值....mp4', dirname='D:/张建光/姜胡说/2021年', noextname='@姜胡说_20201008_我Z核心的底层方法之一_建议多看几遍_刻意...
💬 1[Last reply:1 day ago] 这是显卡显存不足导致的错误。你的 GPU(NVIDIA 显卡)总显存仅有 4.0 GiB,而 Qwen-ASR(1.7B 参数版本)加载后已用 3.42 GiB,剩余空间无法分配额外的 24 MiB,因此直接崩溃。解决方法(按推荐顺序尝试):切换为更节省显存的本地识别渠道:推荐使用 faster-whisper(本地) 并选择 tiny 或 base 模型,这两个模型在 4GB 显存下通常能正常运...106.35* Posted at: 1 day ago -
#5475 TaskCfg(cache_folder='F:/解说配音软件/tmp/12244/a7baaffc1b', target_dir='F:/解说配音软件/output/recogn', remove_noise=False, is_separate=False, detect_language='es', subtitle_language=None, so...
💬 1[Last reply:1 day ago] 这是由于 Google 语音识别 API 需要访问外网,国内网络环境无法直连导致的连接被拒绝。请按以下步骤操作:在主界面第 5 行“网络代理”输入框中填写正确的代理地址,格式如 http://127.0.0.1:7890(请根据你的代理软件实际端口填写)。保存后重新执行任务。如果仍无效,请检查代理是否能正常访问 Google 服务,或尝试更换为无需代理的本地识别渠道(如 faster-whispe...39.163* Posted at: 1 day ago -
#5474 TaskCfg(cache_folder='F:/解说配音软件/tmp/12244/a7baaffc1b', target_dir='F:/解说配音软件/output/recogn', remove_noise=False, is_separate=False, detect_language='es', subtitle_language=None, so...
💬 1[Last reply:1 day ago] 这是由于未配置网络代理所致。Google 识别API(免费) 在中国大陆地区无法直接连接,必须通过代理访问。解决方法:在软件主界面 翻译视频和音频 的底部 网络代理 输入框中,填写您的代理地址,格式如 http://127.0.0.1:10809 或 socks5://127.0.0.1:1080。保存后重新开始执行。备选方案(无需代理): 将语音识别渠道切换为 faster-whisper(本...39.163* Posted at: 1 day ago -
#5473 你的设备不满足CUDA加速要求,请确认是NVIDIA显卡,并已配置好CUDA环境,点击菜单栏-帮助支持-CUDA help...
💬 1[Last reply:1 day ago] 这个问题通常由以下原因引起,请依次排查:显卡不是 NVIDIA(仅支持N卡,AMD/Intel 集显或独显不兼容)CUDA 环境未正确安装或版本过低(必须为 CUDA 12.8+,cuDNN 9.11+,且环境变量配置完整)解决步骤:第一步:确认显卡型号 打开任务管理器 → 性能 → GPU,查看“GPU 0”或类似名称是否为 NVIDIA。如果不是,则无法使用CUDA加速,请取消勾选“CUDA...128.254* Posted at: 1 day ago -
#5472 videotrans.configure.excepts.StopTask: [GPT-SoVITS] 该渠道需另行部署并启动后可用...
💬 1[Last reply:1 day ago] 这是由于 GPT-SoVITS 本地服务未启动 或 API 地址/端口配置错误 导致连接被拒绝。解决方法:启动 GPT-SoVITS 服务:在本地环境中运行 api.py 或 api_v2.py(默认可执行文件目录下的两个脚本),确保服务监听在 127.0.0.1:9880 端口。启动后控制台应显示 Running on http://127.0.0.1:9880。在 pyVideoTrans 中...1.183* Posted at: 1 day ago -
#5471 TaskCfgVTT(uuid='c1366d8dcd', name='D:/A-sucai/0625/bagai/1/Lisa-260625-0002-ES-DJ-916-TT-BG-V.mp4', dirname='D:/A-sucai/0625/bagai/1', noextname='Lisa-260625-0002-ES-DJ-916-TT-BG-...
💬 1[Last reply:1 day ago] 这个错误是由于 faster-whisper 在处理音频时遇到非法负值时间戳导致的内部断言失败,常见于音频片段极短或 VAD 切分异常的场景。解决方案(按优先级排序)取消勾选“Whisper预分割音频” 进入 菜单 → 高级选项 → 语音识别参数,找到“Whisper预分割音频?”并取消勾选。这能避免 VAD 切分产生异常时序片段。更换更稳定的模型 将语音识别模型从 large-v3 改为 l...107.151* Posted at: 1 day ago -
#5470 videotrans.configure.excepts.DubbingSrtError: The upstream Gradio app has raised an exception but has not enabled verbose error reporting. To enable, set show_error=True in launch(...
💬 1[Last reply:1 day ago] 这个错误是因为你使用的本地 TTS 服务(如 F5-TTS、CosyVoice、ChatTTS 等基于 Gradio 的程序)在启动时没有开启详细错误报告,导致 pyVideoTrans 无法获取准确的失败原因。解决方法:开启 Gradio 错误报告:找到你部署的本地 TTS 服务启动脚本(通常是 app.py、webui.py 或类似文件),在 launch() 函数中添加参数 show_err...103.151* Posted at: 1 day ago -
#5469 videotrans.configure.excepts.VideoTransError: please run uv sync --extra qwentts...
💬 1[Last reply:1 day ago] 明确原因是 Qwen-TTS 所需的可选依赖未安装。请在项目根目录执行以下命令:uv sync --extra qwentts安装完成后重启软件即可使用 Qwen-TTS 配音。请查阅相关文档:Qwen-TTS(本地内置)...103.151* Posted at: 1 day ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.
Dondate: ko-fi.com/jianchang512