• #3972 不存在参考音频 D:/win-pyvideotrans-v3.98-0406/f5-tts/D:\win-pyvideotrans-v3.98-0406\f5-tts\zhouxinxin.WAV...
    💬 3
    [Last reply:2 months ago] 这是由于 F5-TTS 作为配音渠道,其配置入口不在“翻译设置”中,而是在“配音设置”或“TTS设置”中。解决方案:1. 在软件主界面顶部菜单栏,点击 菜单。2. 在下拉菜单中,找到并点击 配音设置 或 TTS设置(具体名称可能因版本略有不同,请查找与“配音”相关的设置项)。3. 在弹出的设置窗口中,你应该能找到 F5-TTS 或 F5-TTS设置 的选项卡或配置区域。4. 在该配置页面中...
    61.93* Posted at: 2 months ago
  • #3978 TaskCfgSTS(is_cuda=False, uuid='2c3f0f967a', cache_folder=None, target_dir='C:/Users/USER/Videos/pyvideotrans/translate', source_language=None, source_language_code='English', sour...
    💬 1
    [Last reply:2 months ago] 这是由于 Gemini AI 模型服务器负载过高,请求被暂时拒绝导致的。降低请求频率:在 菜单-工具-高级选项 的【字幕翻译调整】部分,将 翻译后暂停秒 设置为一个较大的值(例如 10-30 秒),以降低请求频率。稍后重试:Gemini 官方提示“需求高峰通常是暂时的”,请等待一段时间后,重新执行翻译任务。更换翻译渠道:如果问题持续,可以暂时切换到其他 AI 翻译渠道,例如 DeepSeek 或 ...
    219.71* Posted at: 2 months ago
  • #3977 TaskCfgSTT(is_cuda=True, uuid='96b04c140b', cache_folder='E:/Fanyizimu/tmp/15364/96b04c140b', target_dir='E:/Fanyizimu/output/recogn', source_language=None, source_language_code=No...
    💬 1
    [Last reply:2 months ago] 这是由于显存或内存不足导致的。错误信息明确指出在使用 faster-whisper(本地) 的 large-v3-turbo 模型时,GPU0 的显存或系统内存不足以完成语音识别任务。解决方案:使用更小的模型:将语音识别模型从 large-v3-turbo 更换为 medium、small 或 base。large-v3-turbo 模型需要大量显存/内存。调整高级设置:在菜单栏 工具/选项 -&...
    124.91* Posted at: 2 months ago
  • #3976 Save audio in G:/pyvideo/f5-tts...
    💬 1
    [Last reply:2 months ago] The issue is that the F5-TTS model files are not being found in the expected directory structure.To resolve this, you need to manually download and place the F5-TTS model files in the correct folder w...
    113.160* Posted at: 2 months ago
  • #3975 TaskCfgTTS(is_cuda=False, uuid='def1f1043a', cache_folder='D:/win-pyvideotrans-v3.98-0406/tmp/17932/def1f1043a', target_dir='D:/win-pyvideotrans-v3.98-0406/output/tts', source_lang...
    💬 1
    [Last reply:2 months ago] 这是由于 CosyVoice 配音渠道在尝试使用声音克隆时,指定的参考音频文件路径不存在或路径格式错误导致的。错误信息显示软件在以下路径寻找参考音频文件失败:D:/win-pyvideotrans-v3.98-0406/f5-tts/D:\win-pyvideotrans-v3.98-0406\f5-tts\zixia.WAV该路径混合了正斜杠 (/) 和反斜杠 (\),并且重复了部分目录,表明路...
    61.93* Posted at: 2 months ago
  • #3974 videotrans.configure._except.StopRetry: f5-tts\zhouxinxin.WAV 角色不存在...
    💬 3
    [Last reply:2 months ago] 日志显示软件启动和GPU检测正常,但缺少具体的错误信息。从之前的错误 f5-tts\zhouxinxin.WAV 角色不存在 来看,问题核心是你在使用 CosyVoice 进行声音克隆时,软件尝试使用了一个名为 f5-tts\zhouxinxin.WAV 的角色,而这个角色并不存在于 CosyVoice 的可用角色列表中。解决方案:检查配音角色选择:在软件主界面的“配音角色”下拉列表中,确保你选择...
    61.93* Posted at: 2 months ago
  • #3973 videotrans.configure._except.StopRetry: D:/win-pyvideotrans-v3.98-0406/f5-tts/f5-tts\zhouxinxin.WAV is not exists...
    💬 1
    [Last reply:2 months ago] 该错误是由于 CosyVoice 配音渠道在尝试使用声音克隆时,找不到指定的参考音频文件导致的。问题原因:当你在配音角色中选择了 clone(克隆)时,软件会尝试从原始视频中提取对应时间段的音频片段作为参考音色。错误信息 D:/win-pyvideotrans-v3.98-0406/f5-tts/f5-tts\zhouxinxin.WAV is not exists 表明软件在 f5-tts 目录...
    61.93* Posted at: 2 months ago
  • #3879 自定义ffmpeg参数无效,-hwaccel cuda -hwaccel_device 0 -c:v h264_nvenc -qsv disable...
    💬 9
    [Last reply:2 months ago] 会首先尝试检测 h264_nvenc 是否可用,如果可用,将直接使用它,实际用到了 qsv,说明不支持或检测支持失败。可以删掉 软件目录/videotrans/codec.json 文件,然后重试,将再次检测支持的ffmpeg编码器。...
    153.121* Posted at: 2 months ago
  • #3970 不存在参考音频 D:/win-pyvideotrans-v3.98-0406/f5-tts/D:\win-pyvideotrans-v3.98-0406\f5-tts...
    💬 1
    [Last reply:2 months ago] 这是由于在配置 F5-TTS 配音渠道时,参考音频的路径格式错误导致的。路径中包含了重复的盘符和路径分隔符,导致软件无法找到有效的参考音频文件。解决方案:检查并修正 F5-TTS 的 API 地址配置。打开 pyVideoTrans 软件。点击顶部菜单栏的 菜单 -> 配音设置。在配音设置面板中,找到 F5-TTS 或 Index-TTS 的设置区域。确保 API地址 一栏填写正确。通常应为...
    61.93* Posted at: 2 months ago
  • #3969 videotrans.configure._except.StopRetry: Role giong1 does not exist...
    💬 1
    [Last reply:2 months ago] This error occurs because the F5-TTS service does not recognize the voice role name "giong1" you selected. The role name is likely a custom name defined in your local F5-TTS service configuration, but...
    117.4* Posted at: 2 months ago
  • #3968 使用克隆音,提供的音色样本的语速是不是也会影响最终配音的语速?...
    💬 1
    [Last reply:2 months ago] 是的,克隆音色时,参考音频的语速会影响最终配音的语速。克隆配音(如使用 F5-TTS、GPT-SoVITS、CosyVoice 等渠道)的原理是:软件会提取参考音频(即原视频中对应字幕时长的语音片段)的音色特征。如果参考音频的语速较快或较慢,克隆生成的配音也会倾向于保持相似的语速特征。优化建议:确保参考音频质量:在“高级选项” -> “语音识别参数”中,将“最短语音持续毫秒”设为 3000,...
    103.172* Posted at: 2 months ago
  • #3967 两排字幕,是否能调整行间距...
    💬 1
    [Last reply:2 months ago] 可以调整字幕的行间距。调整方法如下:点击主界面中的 设置更多参数... 按钮。在弹出的窗口中,点击 修改硬字幕 按钮。在硬字幕样式编辑器中,找到 行间距 设置项,输入您需要的数值(例如,增加数值以扩大行间距)。点击 保存 按钮应用设置。请查阅相关文档:设置字幕的字体...
    120.229* Posted at: 2 months ago
  • #3966 恢复标题有什么用...
    💬 1
    [Last reply:2 months ago] “恢复标题”功能用于在语音识别后,尝试为识别出的文本自动添加标点符号,使其更符合书面阅读习惯,提高字幕的可读性。请查阅相关文档:恢复标点...
    2409:8a55* Posted at: 2 months ago
  • #3965 ở TTS của edge ứng dụng có gửi 1 lúc 4 request không hay gửi từng cái rồi delay rồi gửi tiếp...
    💬 1
    [Last reply:2 months ago] Edge-TTS 渠道默认会并发发送多个请求以加快处理速度,这可能导致触发微软服务器的限流机制,从而返回 403 错误或生成静音文件。要改为逐个发送并延迟,请按以下步骤调整设置:打开软件,点击顶部菜单栏的 工具 -> 高级选项。在“字幕配音调整”区域,找到 并发配音线程数,将其值设为 1。在同一区域,找到 配音后暂停秒,将其值设为 5 到 10 秒(例如 5)。点击“保存”并关闭设置窗口。此...
    2001:ee0* Posted at: 2 months ago
  • #3964 中英双字怎么做...
    💬 1
    [Last reply:2 months ago] 中英双字幕(双字幕)可以通过在“嵌入字幕”选项中选择“双硬字幕”或“双软字幕”来实现。具体操作步骤如下:在软件主界面,完成视频选择、语音识别、翻译和配音等设置。在“嵌入字幕”一行,点击下拉菜单。选择“嵌入硬字幕(双)”或“嵌入软字幕(双)”。嵌入硬字幕(双):将中英文字幕永久“烧录”到视频画面中,在任何播放器都会显示,无法关闭。嵌入软字幕(双):将中英文字幕作为独立轨道封装进视频文件,播放器(如P...
    2409:8a55* Posted at: 2 months ago
  • #3962 ModuleNotFoundError: No module named 'torch'...
    💬 1
    [Last reply:2 months ago] 这是由于Python环境中缺少PyTorch库导致的。软件在启动时尝试检查CUDA加速环境,但未能导入必需的torch模块。解决方案:请确保您是通过源码部署运行,而非Windows预打包版。预打包版应已包含所有依赖,不应出现此错误。如果您是源码运行,请使用uv包管理器在项目根目录下重新同步依赖:uv sync如果上述命令无效,可以尝试手动安装PyTorch(请确保CUDA版本为12.8):uv p...
    103.172* Posted at: 2 months ago
  • #3961 ten-vad和Silero的区别...
    💬 1
    [Last reply:2 months ago] VAD(语音活动检测)用于在语音识别前切分音频,区分语音段和静音/噪音段。ten-vad 和 silero 是两种不同的 VAD 模型,主要区别在于性能和资源消耗。区别与选择建议:ten-vad:基于 Tencent 的 VAD 模型,对中文语音的检测效果通常更好,更准确。silero:一个通用的 VAD 模型,支持多种语言,在非中文场景下表现良好,资源消耗相对较低。如何选择:如果您的原始视频是中...
    2409:8a55* Posted at: 2 months ago
  • #3960 TaskCfgVTT(is_cuda=True, uuid='49eb0faa0d', cache_folder='G:/VideoTrans/tmp/2536/49eb0faa0d', target_dir='D:/Bl tuatriol/A Z Guide/4 - Chapter 4 Advanced Animation/04/71. 04_01 Wal...
    💬 1
    [Last reply:2 months ago] 这是由于显存或内存不足导致的。错误信息明确指出在使用 faster-whisper(本地) 的 large-v3-turbo 模型时,GPU0 的显存或系统内存不足,导致进程池崩溃。解决方案:降低模型大小:将语音识别模型从 large-v3-turbo 更换为更小的模型,例如 medium、small 或 base。large-v3-turbo 模型对显存要求较高。调整高级设置:在菜单栏 工具/选...
    119.123* Posted at: 2 months ago
  • #3959 ConnectionAbortedError: [WinError 10053] An established connection was aborted by the software in your host machine...
    💬 1
    [Last reply:2 months ago] This error is caused by an unstable network connection or interruption during the use of the Google Speech Recognition service.The error log indicates that the connection was aborted (ConnectionAborte...
    103.49* Posted at: 2 months ago
  • #3958 [DEBUG] [job] 进入执行语音识别阶段 trk.cfg=TaskCfgSTT(is_cuda=True, uuid='de5511f6aa', cache_folder='E:/videoTrans/tmp/19044/de551......
    💬 1
    [Last reply:2 months ago] 你选择了“Faster-Whisper-XXL”语音识别渠道,但该渠道无法在Windows预打包版(.exe)中直接使用。根据日志错误信息 当前Faster-Whisper-XXL无法在打包版中使用,请源码部署或单独使用Faster-Whisper-XXL转录,这是软件的限制。Faster-Whisper-XXL是一个独立的可执行文件,与打包版的pyVideoTrans存在兼容性问题。解决方案:更...
    2406:da14* Posted at: 2 months ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update. Dondate: ko-fi.com/jianchang512

Related resource