#1549 TaskCfg(cache_folder='G:/Speech/win-videotrans-v3.81_20251007_175837/tmp47036/1637938394', target_dir='G:/合成转移01/8 - Usi

38.181* Posted at: 1 day ago 👁24

合并阶段出错:运行时错误:最后一步字幕配音嵌入时出错:
Traceback (most recent call last):
File "videotrans\util\help_ffmpeg.py", line 227, in runffmpeg
File "subprocess.py", line 524, in run
subprocess.CalledProcessError: Command '['ffmpeg', '-hide_banner', '-ignore_unknown', '-threads', '0', '-y', '-progress', 'G:/Speech/win-videotrans-v3.81_20251007_175837/tmp47036/compose1763716482.0047715.txt', '-i', 'G:/Speech/win-videotrans-v3.81_20251007_175837/tmp47036/1637938394/novoice.mp4', '-i', 'G:/Speech/win-videotrans-v3.81_20251007_175837/tmp47036/1637938394/target_dubbing.m4a', '-i', 'shuang.srt', '-c:v', 'copy', '-c:a', 'copy', '-c:s', 'mov_text', '-metadata:s:s:0', 'language=chi', '-movflags', '+faststart', '-cq', '25', '-preset', 'p1', '-shortest', 'G:/合成转移01/8 - Using MongoDB with Mongoose83 - Connecting Our Database with the Express App/8 - Using MongoDB with Mongoose83 - Connecting Our Database with the Express App.mp4']' returned non-zero exit status 4294967294.

During handling of the above exc
......
-i', 'G:/Speech/win-videotrans-v3.81_20251007_175837/tmp47036/1637938394/novoice.mp4', '-i', 'G:/Speech/win-videotrans-v3.81_20251007_175837/tmp47036/1637938394/target_dubbing.m4a', '-i', 'shuang.srt', '-c:v', 'copy', '-c:a', 'copy', '-c:s', 'mov_text', '-metadata:s:s:0', 'language=chi', '-movflags', '+faststart', '-crf', '25', '-preset', 'fast', '-shortest', 'G:/合成转移01/8 - Using MongoDB with Mongoose83 - Connecting Our Database with the Express App/8 - Using MongoDB with Mongoose83 - Connecting Our Database with the Express App.mp4']' returned non-zero exit status 4294967294.

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
File "videotrans\task\trans_create.py", line 1227, in _join_video_audio_srt
File "videotrans\util\help_ffmpeg.py", line 267, in runffmpeg
File "videotrans\util\help_ffmpeg.py", line 272, in runffmpeg
RuntimeError: opening input: No such file or directory opening input file shuang.srt. opening input files: No such file or directory

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
File "videotrans\task\job.py", line 299, in run
File "videotrans\task\trans_create.py", line 539, in assembling
File "videotrans\task\trans_create.py", line 1230, in _join_video_audio_srt
RuntimeError: 最后一步字幕配音嵌入时出错

TaskCfg(cache_folder='G:/Speech/win-videotrans-v3.81_20251007_175837/tmp47036/1637938394', target_dir='G:/合成转移01/8 - Using MongoDB with Mongoose83 - Connecting Our Database with the Express App', remove_noise=False, is_separate=False, detect_language='en', subtitle_language=None, source_language='英语', target_language='简体中文', source_language_code='en', target_language_code='zh-cn', source_sub='G:/合成转移01/8 - Using MongoDB with Mongoose83 - Connecting Our Database with the Express App/en.srt', target_sub='G:/合成转移01/8 - Using MongoDB with Mongoose83 - Connecting Our Database with the Express App/zh-cn.srt', source_wav='G:/Speech/win-videotrans-v3.81_20251007_175837/tmp47036/1637938394/en.wav', source_wav_output='G:/合成转移01/8 - Using MongoDB with Mongoose83 - Connecting Our Database with the Express App/en.m4a', target_wav='G:/Speech/win-videotrans-v3.81_20251007_175837/tmp47036/1637938394/target.wav', target_wav_output='G:/合成转移01/8 - Using MongoDB with Mongoose83 - Connecting Our Database with the Express App/zh-cn.m4a', subtitles='', novoice_mp4='G:/Speech/win-videotrans-v3.81_20251007_175837/tmp47036/1637938394/novoice.mp4', noextname='8 - Using MongoDB with Mongoose83 - Connecting Our Database with the Express App', shibie_audio=None, targetdir_mp4='G:/合成转移01/8 - Using MongoDB with Mongoose83 - Connecting Our Database with the Express App/8 - Using MongoDB with Mongoose83 - Connecting Our Database with the Express App.mp4', instrument=None, vocal=None, back_audio='', background_music=None, app_mode='biaozhun', subtitle_type=4, volume='+0%', pitch='+1Hz', voice_rate='+0%', voice_role='F:\Speech\TSJM\真要站着不动的话,干脆来当我的模特吧。给你设计款好看的衣服。.wav', copysrt_rawvideo=False, clear_cache=False, translate_type=4, tts_type=10, recogn_type=0, model_name='large-v3-turbo', split_type=0, voice_autorate=True, video_autorate=False, cuda=True, name='//bltar/g_yy/JavaScript/Jonas Schmedtmann/04_Node.js, Express, MongoDB & More The Complete Bootcamp 2024-11/EN/8 - Using MongoDB with Mongoose83 - Connecting Our Database with the Express App.mp4', basename='8 - Using MongoDB with Mongoose83 - Connecting Our Database with the Express App.mp4', ext='mp4', dirname='//Bltar/g_yy/JavaScript/Jonas Schmedtmann/04_Node.js, Express, MongoDB & More The Complete Bootcamp 2024-11/EN', shound_del_name=None, uuid='1637938394', remove_silent_mid=False, align_sub_audio=True, enable_diariz=False, nums_diariz=0)


=
system:Windows-10-10.0.26200-SP0
version:v3.85
frozen:True
language:zh
root_dir:G:/Speech/win-videotrans-v3.81_20251007_175837

3.85版本.比之前的版本好多了.可以一次处理超过20-30个都不报错了.但有几次在传批量处理的时候:最后一步字幕配音嵌入时出错.有几次报错了.

7 Replies

这个错误是由于 FFmpeg 在合并阶段找不到字幕文件 shuang.srt 导致的。从错误日志可以看到 opening input file shuang.srt. opening input files: No such file or directory

解决方案:

  1. 检查字幕文件路径:确保字幕文件 shuang.srt 存在于 FFmpeg 运行的当前工作目录中。从错误信息看,FFmpeg 在当前目录查找 shuang.srt,但该文件可能不存在或路径不正确。
  2. 使用绝对路径:在高级选项中,尝试为字幕文件使用完整的绝对路径,而不是相对路径。
  3. 清理缓存重新处理

    • 在主界面勾选 "清理已生成" 选项
    • 重新处理该视频文件
  4. 检查文件权限:确保软件对输出目录 G:/合成转移01/... 有写入权限。
  5. 简化文件路径:如果问题持续存在,尝试将视频文件移动到路径更短、不含特殊字符和空格的目录(如 D:/tmp/video.mp4)进行处理。

这个错误通常是由于文件路径问题或临时文件丢失导致的,清理缓存后重新处理通常可以解决。

出错几率是百分之四. 我处理了100个左右视频,4个报这个错误了.

这个4%的出错率表明是偶发性问题,通常与文件系统或临时文件处理相关。建议按以下步骤排查:

  1. 检查输出目录权限:确保软件对 G:/合成转移01/ 目录有完整的读写权限。网络路径或某些特殊目录可能存在权限限制。
  2. 简化文件路径:将源视频文件复制到本地简单路径(如 D:/temp/video.mp4)再进行处理,排除路径过长或特殊字符的影响。
  3. 调整高级设置

    • 工具/选项 -> 高级选项 中,将 "视频输出质量控制" 从默认的23调整为25-28
    • 将 "输出视频压缩率" 从 fast 改为 medium
  4. 处理失败的文件:对于那4个失败的文件,单独重新处理时务必勾选主界面的 "清理已生成" 选项。
  5. 监控磁盘空间:确保 G 盘和系统临时目录有足够的剩余空间。

这种偶发性错误通常与文件系统的瞬时状态有关,通过简化路径和调整输出参数可以有效降低出错概率。

我目前使用的gps sovits. 一句话10-30个字. 大概要1-2秒 一句停不到1秒吧.感觉有点慢了.在目前支持的语音合成也就是目前支持的配音里面.对于本地运行来说.哪一个速度是最快的呢?

在本地运行的配音渠道中,GPT-SoVITS 确实是速度较慢的选项。以下是速度更快的本地配音方案:

1. F5-TTS (推荐)

  • 优势:专门优化推理速度,比 GPT-SoVITS 快很多
  • 设置:在配音角色下拉菜单中选择 F5-TTS 角色
  • 特点:支持中文,音质自然,推理速度快

2. CosyVoice (推荐)

  • 优势:字节跳动出品,支持中英文,推理速度快
  • 设置:选择 CosyVoice 角色
  • 特点:零样本语音克隆,无需训练即可使用

3. Edge-TTS (最快)

  • 优势:虽然是微软在线服务,但速度极快,延迟低
  • 设置:选择 Edge-TTS 角色
  • 特点:免费,支持多种语言和音色

4. Fish-TTS

  • 优势:轻量级本地 TTS,速度快
  • 设置:选择 Fish-TTS 角色

速度优化建议

  • 在高级选项中,将"同时配音字幕数"适当调高(如设为3-5)
  • 确保已勾选 CUDA 加速
  • 如果使用 GPU,检查显存占用情况

推荐顺序:F5-TTS > CosyVoice > Edge-TTS > Fish-TTS

建议先试用 F5-TTS 或 CosyVoice,它们在速度和音质之间取得了较好平衡。

那对比显存占用率一下.F5-TTS CosyVoice Fish-TTS gpt-sovits

以下是各本地配音方案的显存占用对比(从低到高):

  1. Fish-TTS - 显存占用最低

    • 约 1-2GB 显存
    • 轻量级模型,推理速度快
    • 适合显存较小的显卡
  2. F5-TTS - 显存占用中等

    • 约 2-4GB 显存
    • 在速度和音质间平衡较好
    • 推荐作为首选方案
  3. CosyVoice - 显存占用中等偏高

    • 约 3-5GB 显存
    • 零样本语音克隆,无需训练
    • 支持中英文混合
  4. GPT-SoVITS - 显存占用最高

    • 约 4-8GB 显存(取决于模型大小)
    • 推理速度最慢
    • 音质较好但资源消耗大

推荐选择:

  • 显存 ≤ 4GB:优先使用 Fish-TTS
  • 显存 4-8GB:推荐 F5-TTS
  • 显存 ≥ 8GB:可尝试 CosyVoice

优化建议:
在高级选项中启用 CUDA 加速,并根据实际显存情况调整"同时配音字幕数"(显存小则调低此值)。

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Donate: https://ko-fi.com/jianchang512

Trending Questions