• #3627 88-Heart Blood Flow.mp4没有识别出字幕,请检查是否包含人类说话声音,以及说话语言是否和你选择的原始语言匹配...
    💬 1
    [Last reply:2 months ago] 这是由于语音识别未检测到有效语音或原始语言选择不匹配导致的。确认视频内容:首先,请确认 88-Heart Blood Flow.mp4 视频中确实包含清晰的人类说话声音,而非纯音乐、环境音或极低音量语音。检查原始语言设置:在软件主界面“发音语言”下拉列表中,必须明确选择视频中人物说话的语言(例如“英语”或“中文”)。新版(v3.98)在视频翻译功能中已移除“自动检测”选项,必须手动指定。调整语音识...
    113.128* Posted at: 2 months ago
  • #3626 TaskCfgSTT(is_cuda=False, uuid='d8dbfbd85b', cache_folder='E:/win-pyvideotrans-v3.98-314/tmp/4316/d8dbfbd85b', target_dir='E:/win-pyvideotrans-v3.98-314/output/recogn', source_lang...
    💬 1
    [Last reply:2 months ago] 这是由于语音识别模型未能从音频中检测到有效的语音片段导致的。从日志看,你选择了 faster-whisper(本地) 模型,原始语言设置为英语 (en),但模型未识别出任何语音。请按以下步骤排查:检查视频内容:确认所选视频 G:/X_hopbxsmrmrsstt_Shawty_was_ready_to_risk_it_all_Get_video_here_httpstcoArEU4hOIh3_ht...
    2602:feda* Posted at: 2 months ago
  • #3625 TaskCfgSTT(is_cuda=False, uuid='d4c19bc720', cache_folder='E:/win-pyvideotrans-v3.86/tmp/17512/d4c19bc720', target_dir='e:/win-pyvideotrans-v3.86/output/recogn', source_language=No...
    💬 1
    [Last reply:2 months ago] 这是由于 faster-whisper 依赖的 tokenizers 库版本不兼容或损坏导致的。请确保你使用的是 完整版 软件包,而非补丁包。如果下载的是补丁包,请重新下载完整版 .7z 压缩包。如果问题依旧,这通常是打包环境与你的运行环境不匹配所致。建议尝试以下任一方法:方法一(推荐):升级到最新版本 v3.98 的完整包。方法二:在 Windows 上,可以尝试使用源码部署方式运行。具体步骤为...
    2602:feda* Posted at: 2 months ago
  • #3624 Exception with an error code: 0x5 (SPXERR_INVALID_ARG)...
    💬 1
    [Last reply:2 months ago] 这是由于 Azure TTS 渠道的依赖库文件缺失或损坏导致的。请确保你使用的是 完整版 软件包(.7z 压缩包),而不是补丁包。补丁包可能不包含完整的依赖文件。如果已经是完整版,则问题很可能是因为操作系统缺少必要的 VC++ 运行库。请下载并安装微软的 VC++ 可再发行组件包。微软 VC++ 可再发行组件包下载地址安装完成后,重启计算机,然后再次尝试运行软件。请查阅相关文档:AzureTTS ...
    38.6* Posted at: 2 months ago
  • #3623 TaskCfgVTT(is_cuda=True, uuid='c415c8afdd', cache_folder='D:/MyProgram/win-pyvideotrans-v3.98-314/tmp/6472/c415c8afdd', target_dir='D:/Download/软件/_video_out/NEW OpenClaw AI Browse...
    💬 1
    [Last reply:2 months ago] 这是由于显存不足导致的。错误信息 RuntimeError: CUDA failed with error out of memory 表明在使用 faster-whisper(本地) 的 large-v3-turbo 模型进行语音识别时,显卡的显存(VRAM)耗尽。解决方案:降低模型要求:在语音识别渠道的下拉菜单中,将模型从 large-v3-turbo 更换为更小的模型,例如 large-v1...
    69.63* Posted at: 2 months ago
  • #3622 转文字只用集显 不用独显 报显存不足怎么破...
    💬 11
    [Last reply:2 months ago] 要让 qwen-asr(本地) 语音识别的速度提起来,核心在于充分利用您的 NVIDIA 5070 Ti 显卡进行 GPU 加速,并优化相关参数。qwen-asr 本身支持 CUDA 加速,但需要正确配置。解决方案如下:确保 CUDA 环境已正确配置并启用:在软件主界面,务必勾选 CUDA加速 选项。确认您已按照之前的建议设置了 CUDA_VISIBLE_DEVICES 环境变量,并已重启软件。调...
    39.144* Posted at: 2 months ago
  • #3619 我用的5090+96g内存,没道理报内存显存不足啊……TaskCfgSTT(is_cuda=True, uuid='fc59b7c1a8', cache_folder='D:/GJ/win-pyvideotrans-v3.98-314/tmp/27604/fc59b7c1a8', target_dir='D:/GJ/win-pyvideotrans-v3.9...
    💬 3
    [Last reply:2 months ago] 感谢分享解决方案。你遇到的问题是软件运行时错误地使用了集成显卡,而非NVIDIA独立显卡(如5070 Ti),导致CUDA加速失败并引发进程崩溃。核心原因是系统默认的GPU分配策略或驱动问题,导致CUDA进程被分配到了不支持CUDA加速的集成显卡上。解决步骤与你分享的一致:确定显卡序号:在命令行中运行 nvidia-smi 命令,查看你的5070 Ti显卡对应的序号(最左侧的 [0] 或 [1])...
    203.10* Posted at: 2 months ago
  • #3621 字幕颜色格式怎么修改...
    💬 1
    [Last reply:2 months ago] 字幕颜色格式的修改需要通过“修改硬字幕样式”功能实现。在视频翻译主界面,点击“设置更多参数...”。在弹出的窗口中,找到并点击“修改硬字幕样式”按钮。在打开的“硬字幕样式编辑器”中,您可以修改以下样式属性:字体:选择字幕字体。字体大小:调整字幕字号。字体颜色:设置字幕文字的颜色。描边颜色:设置文字描边的颜色。背景颜色:设置字幕背景框的颜色。位置:调整字幕在画面中的显示位置。修改完成后,点击“确定”...
    112.23* Posted at: 2 months ago
  • #3620 OSError: Could not find/load shared object file...
    💬 3
    [Last reply:2 months ago] 这是由于 macOS 系统缺少 llvmlite 库所依赖的 libc++.1.dylib 动态链接库文件,导致 Qwen-TTS(本地) 配音渠道初始化失败。安装缺失的系统库:在终端中执行以下命令,通过 Homebrew 安装 libc++。brew install llvm(注意:libc++ 通常作为 llvm 的一部分提供,直接安装 llvm 即可。)重新安装 llvmlite:安装系统库...
    202.8* Posted at: 2 months ago
  • #1462 输出目录不允许指向输入目录,请使用默认或创建一个空文件夹作为输出...
    💬 3
    [Last reply:2 months ago] 这个错误提示表明你试图将输出目录设置为输入视频所在的文件夹或其子文件夹,这可能导致原始文件被覆盖。请按以下步骤操作:点击主界面上的“输出到...”按钮。在弹出的对话框中,选择一个与你的原始视频文件完全不同的文件夹(例如,在桌面新建一个名为“视频输出”的空文件夹)。确认选择后,再重新开始翻译任务。请确保输出目录是一个全新的、独立的文件夹,而不是原始视频所在的目录。请查阅相关文档:执行前清理掉旧文件...
    112.195* Posted at: 6 months ago
  • #3618 TaskCfgVTT(is_cuda=True, uuid='b75eebbe5a', cache_folder='C:/Users/Muhammed/Desktop/win-pyvideotrans-v3.98-314/tmp/2624/b75eebbe5a', target_dir='M:/Tutorials/Maya Fundamentals/Maya...
    💬 1
    [Last reply:2 months ago] This error indicates insufficient GPU memory (VRAM) or system memory (RAM) while using the faster-whisper model with CUDA acceleration enabled.The primary cause is that the large-v3-turbo model requir...
    2a00:1d34* Posted at: 2 months ago
  • #3617 为什么导出的mp4格式默认为HEVC而不是H.264...
    💬 1
    [Last reply:2 months ago] 这是因为软件的视频编码默认设置为了 libx265 (HEVC)。要更改为兼容性更好的 libx264 编码,需要进行高级设置。在软件主界面,点击顶部菜单栏的 “工具/选项”。在下拉菜单中选择 “高级选项”。在弹出的高级选项窗口中,找到 “视频输出控制” 区域。将 “264/265编码” 选项从默认的 libx265 修改为 libx264。点击 “保存” 按钮,然后关闭窗口。完成此设置后,后续导...
    149.112* Posted at: 2 months ago
  • #3616 TaskCfgVTT(is_cuda=True, uuid='efebb05883', cache_folder='D:/download/FreeDM/Softs/win-pyvideotrans-v3.97-0304/tmp/37552/efebb05883', target_dir='F:/audio/coding/out/cusor-mp4', so...
    💬 1
    [Last reply:2 months ago] This error indicates that your DeepSeek API account has insufficient balance to process the translation request.To resolve this, you need to recharge your DeepSeek API account.Log in to your DeepSeek ...
    116.110* Posted at: 2 months ago
  • #3615 使用[Faster-Whisper-XXL.exe]报错了...
    💬 1
    [Last reply:2 months ago] 这是由于预打包版(.exe)无法直接调用外部可执行文件 Faster-Whisper-XXL.exe 导致的。Faster-Whisper-XXL.exe 是一个独立的语音识别工具,需要源码部署环境才能通过命令行调用。预打包版软件内部已集成了 faster-whisper 库,无需此独立工具。解决方案:(推荐)使用内置的 faster-whisper(本地) 渠道:在主界面“语音识别”下拉菜单中,...
    43.255* Posted at: 2 months ago
  • #3614 TaskCfgVTT(is_cuda=True, uuid='83ed049529', cache_folder='G:/VideoTrans/tmp/5720/83ed049529', target_dir='D:/Bl tuatriol/Factory 2025/2025/6 - Modeling the Second Module-mp4', sour...
    💬 1
    [Last reply:2 months ago] 该错误是由于系统内存或显存不足,导致进程池中的进程在执行二次识别(recogn2pass)时被意外终止。根据日志,问题发生在视频翻译的合并阶段,具体是在进行二次识别(recogn2pass=True)时,调用了 faster-whisper 模型(model_name='large-v3-turbo')并启用了 CUDA 加速(is_cuda=True),进程因资源不足而崩溃。...
    113.88* Posted at: 2 months ago
  • #3613 requests.exceptions.ChunkedEncodingError: Response ended prematurely...
    💬 1
    [Last reply:2 months ago] 这是由于 GPT-SoVITS API 服务连接不稳定或响应中断导致的。确保 GPT-SoVITS 的 API 服务已正确启动,并且运行在 http://127.0.0.1:7860(或你配置的地址)。在 pyVideoTrans 的“菜单-翻译设置-GPT-SoVITS 设置”中,确认 API 地址与 GPT-SoVITS 服务地址完全一致。如果问题持续,尝试重启 GPT-SoVITS 服务,并...
    126.141* Posted at: 2 months ago
  • #3612 降噪处理后的音频保存在哪里,我每次重试都会重新执行降噪,并且我没有勾选清理已生成...
    💬 1
    [Last reply:2 months ago] 降噪处理后的音频文件保存在每个视频任务对应的临时缓存文件夹中。由于你没有勾选“清理已生成”,软件会复用之前生成的缓存文件,包括降噪后的音频,因此理论上不会每次都重新执行降噪。如果观察到每次都在重新执行降噪,可能是以下原因:缓存文件夹被意外清理:软件根目录下的临时文件夹(如 tmp)或任务特定的缓存文件夹被手动删除或清理。文件路径或名称变更:重新处理的视频文件路径或名称与上次不同,软件会将其视为新任...
    43.255* Posted at: 2 months ago
  • #3611 任务因为网络问题中断,重试后重新执行降噪处理,...
    💬 1
    [Last reply:2 months ago] 这是由于网络不稳定导致模型下载失败,而软件在任务重试时默认会重新执行所有步骤(包括降噪)造成的。要避免重复降噪,可以采取以下步骤:检查网络并手动下载模型:确保网络稳定。如果 faster-whisper 或降噪模型下载失败,可以按照知识库“手动下载适用于 faster-whisper(本地) 语音识别渠道的模型”或“在线下载AI模型失败的解决办法”的指引,手动将模型文件放入 models/ 目录。...
    185.36* Posted at: 2 months ago
  • #3610 FunASR中文识别不是本地模型,为什么还要下载东西...
    💬 1
    [Last reply:2 months ago] 这是因为 FunASR 中文识别渠道虽然标注为在线服务,但其底层实现依赖于本地部署的模型文件来执行语音识别。当你在 pyVideoTrans 中选择“FunASR中文识别”时,软件会尝试从 ModelScope(魔搭社区)在线下载 FunASR 模型文件到本地 models 目录中。下载完成后,识别过程将在你的计算机本地进行,不会将音频数据上传到互联网。这本质上是一个“本地模型”,但软件界面可能未...
    185.36* Posted at: 2 months ago
  • #3600 请问一下 一直出现这种情况是怎么回事的...
    💬 18
    [Last reply:2 months ago] 视频模糊是由于视频转码过程中压缩率过高或编码参数不理想导致的。解决方案:在开始翻译前,点击主界面“设置更多参数...”。在弹出的窗口中,找到并点击“修改硬字幕样式”(即使您不嵌入字幕,此按钮也包含视频输出质量控制选项)。在打开的“字幕样式编辑器”窗口中,找到“视频输出质量控制”滑块。将该值向左侧(数值减小)调整,例如设置为 23 或更低(数值越小,质量越高,文件也越大)。同时,可以调整下方的“输出...
    2409:8a4c* Posted at: 2 months ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource