-
#4277 怎么源部署...
💬 7[Last reply:1 month ago] 根据日志可以确认 CUDA 已经启用。关键证据:日志中 is_cuda: True 表明软件已加载 CUDA 加速配置。GPU进程池:max_workers=1 表示 GPU 进程已启动。语音识别阶段耗时 41s(large-v3-turbo 模型),符合 GPU 加速下的速度。虽然日志没有直接输出 Using CUDA device,但 faster-whisper 在内部调用了 CUDA 完成...67.209* Posted at: 1 month ago -
#4276 RuntimeError: {'detail': 'Not Found'}...
💬 1[Last reply:1 month ago] 这是配音渠道的 API 服务返回了“404 Not Found”错误,通常是因为 API 地址或端口配置错误,或者对应的 TTS 服务未正确启动。请按以下步骤排查:确认配音渠道的 API 地址:在菜单 TTS设置 中检查填写的 API URL 是否完全正确(例如 F5-TTS 通常为 http://127.0.0.1:7860,注意端口号和路径)。检查外部 TTS 服务:如果使用了本地部署的 TT...2409:8d4c* Posted at: 1 month ago -
#4275 必须填写 appid access...
💬 1[Last reply:1 month ago] 这是因为你选择了需要付费密钥的翻译渠道(如百度翻译、腾讯翻译等),但没有在软件中进行配置。解决办法:点击顶部菜单 工具/选项 -> 翻译设置,找到你当前选择的翻译渠道对应的设置面板。在面板中填写正确的 AppID 和 Access Key(密钥需自行到对应平台申请)。如果你不想申请密钥,可以切换到免费翻译渠道(如 Google翻译、微软翻译、M2M100本地翻译),这些不需要填写密钥。请查阅...2a09:bac1* Posted at: 1 month ago -
#4273 KeyError: 'duration'...
💬 1[Last reply:1 month ago] 这是ffmpeg无法读取视频信息导致的,通常由文件损坏、路径过长或含特殊符号引起。检查视频文件:确保视频能正常播放,未被损坏。简化路径和文件名:将视频移动到短目录(如 D:\test)。重命名为不含中文、空格、特殊符号的简短英文名(例如 1.mp4)。检查编码格式:建议使用 H.264 编码的 MP4 文件,兼容性最好。如果以上均无效,请提供软件目录下 logs/ 文件夹中最新日志的底部约 30 ...107.173* Posted at: 1 month ago -
#4271 LLM重新断句的提示词在哪改...
💬 7[Last reply:1 month ago] 在菜单栏 → 工具/选项 → 高级选项 → 语音识别参数部分,应有一个名为“断句模式”或“rephrase”的下拉/单选选项(可能显示为数字选择框)。可将其值设为 2 以启用自动修正(同时也会进行LLM重新断句)。如果界面中确实没有任何相关选项,可能是软件版本UI差异,建议手动修改配置文件(通常位于软件目录下的videotrans/configure/config.ini或settings.jso...2409:8a55* Posted at: 1 month ago -
#4270 有些字发音不正确,比如3ds,中文翻译成3毫秒...
💬 7[Last reply:1 month ago] 是的,如果术语表配置为 3ds=3ds(游戏平台),那么在翻译后的字幕文本中会包含“3ds(游戏平台)”这一完整内容,配音时将完整读出“3ds(游戏平台)”。 如果不想让括号里的说明被配音读出,只需将术语表改为 3ds=3ds 即可,这样翻译时会保留原文“3ds”,配音时也只读“3ds”。...2409:8a55* Posted at: 1 month ago -
#4269 语音识别的提示词在哪设置...
💬 3[Last reply:2 months ago] 在“Whisper模型提示词”设置中,写法和目的分为两种:热词:以英文逗号分隔单词,告诉模型这些词容易出现。例如:深度学习,人工智能,卷积神经网络上下文提示:写一个完整短语,描述视频的主题或说话风格,可提高特定领域识别率。例如:这是一段关于医学讲座的录音,重点关注专业术语和数字。请参考文档中的具体设置位置:高级设置各个选项说明(搜索“Whisper模型提示词”)...2409:8a55* Posted at: 2 months ago -
#4267 温度值设置支持0.15和0.125这样的值吗?...
💬 1[Last reply:2 months ago] 知识库中未明确说明温度值支持小数的具体范围,但通常AI模型温度值是一个0到1之间的浮点数,0.15和0.125属于合理范围。你可以直接在软件界面的“菜单 -> 工具/选项 -> 高级选项 -> 字幕翻译调整”中修改该值尝试,如果遇到报错请提供日志。...174.139* Posted at: 2 months ago -
#4259 [DEBUG] result={'visible': True, 'value': 'C:\Users\Admin\AppData\Local\Temp\gradio\b63dccf3804fc531779443a72840298a1eb1......
💬 27[Last reply:2 months ago] 无法手动修改,translate_type 是软件根据当前选择的翻译渠道自动生成的,手动改配置文件不会生效且可能导致异常。从你的描述来看,问题根源很可能是软件识别 DeepSeek 渠道的代码存在 bug 或安装包版本与渠道定义不匹配,导致无论你选什么 AI 翻译渠道,内部都错误地映射为传统渠道(值为4)。既然已经完整重装并重新配置仍无效,请按以下步骤彻底排查:确认下载的是“完整包”而非“补丁包”...2409:8a55* Posted at: 2 months ago -
#4266 TaskCfgVTT(is_cuda=True, uuid='a7b0810154', cache_folder='F:/win-pyvideotrans-v3.99-418/tmp/32316/a7b0810154', target_dir='F:/AAA/Fundamentals of Photography/_video_out/04 - Shutte...
💬 1[Last reply:2 months ago] 这是由于 CUDA 运行失败导致的,常见原因有显卡驱动过旧、CUDA 版本不兼容、显存不足或 GPU 被其他程序占用。解决步骤:确认 CUDA 环境:确保已安装 CUDA 12.8 和 cuDNN 9.11+。可在 CMD 中运行 nvcc -V 查看版本,nvidia-smi 查看显卡驱动和可用显存。降低显存占用(按顺序尝试):在语音识别下拉菜单中切换为 small 或 medium 模型(当前...119.237* Posted at: 2 months ago -
#4265 TaskCfgVTT(is_cuda=True, uuid='17f1a08bbe', cache_folder='D:/win-pyvideotrans-v3.95/tmp/11616/17f1a08bbe', target_dir='F:/zmm/20世纪/001/_video_out/001-2 调式变奏第1部分 - Diatonic variatio...
💬 1[Last reply:2 months ago] 这是由于显存不足导致进程崩溃。您的日志显示已启用二次识别(recogn2pass=True),这会额外占用大量显存。解决方案:立即取消二次识别:在主界面取消勾选“二次识别”选项,然后重新尝试。如仍不足:将语音识别模型从 large-v3-turbo 切换为更小的模型(如 medium 或 small)。调整高级选项:在 菜单 → 工具 → 高级选项 → 语音识别参数 中:将 CUDA数据类型 改为...36.142* Posted at: 2 months ago -
#4263 E:\AI_Tools\pyvideotrans>.venv\Scripts\python.exe -c "import torch; print(f'识别显卡: {torch.cuda.is_available()}'); prin......
💬 19[Last reply:2 months ago] 在软件主界面勾选 CUDA加速 后,开始语音识别(如 faster-whisper)时,你可以打开任务管理器(Ctrl+Shift+Esc)-> 性能 -> GPU,观察 GPU 利用率是否上升。如果 GPU 有负载,说明正常调用了显卡。也可以查看 logs 日志,搜索 “CUDA” 确认有相关提示。...192.243* Posted at: 2 months ago -
#4264 打轴字幕样式如何设定?...
💬 3[Last reply:2 months ago] 翻译完成后没有弹出确认窗口直接合成,最常见的原因是您当前处于批量处理模式(勾选了主界面上的“文件夹”选项)或未选择单个视频。单视频交互模式仅在处理单个视频时才会在识别后、翻译后、配音后弹出编辑窗口。如果您需要手动调整字幕和配音,请确保只拖入一个视频,且不勾选“文件夹”复选框。如果确认是单视频模式但仍未弹出,可能是软件配置异常。请检查日志文件(logs/ 目录下最新的 .log 文件)底部约30行内...5.34* Posted at: 2 months ago -
#4262 TaskCfgVTT(is_cuda=True, uuid='5863c1afa7', cache_folder='F:/win-pyvideotrans-v3.99-418/tmp/26992/5863c1afa7', target_dir='F:/AAA/buji/_video_out/第1回\u3000はじめよう\u3000簿記! ~資産・負債・純資...
💬 1[Last reply:2 months ago] 翻译时遇到429错误,是因为请求频率过快触发了字节火山大模型的限流机制。解决方案:打开顶部菜单 工具/选项 → 高级选项 → 字幕翻译调整。将 “翻译后暂停秒” 设为 5-10(单位:秒),降低请求频率。将 “AI翻译渠道每批字幕行数” 适当调低,例如设为 10 左右,减少单次请求负载。如果仍频繁报错,请关闭软件重新启动后重试,让限流状态重置。请查阅相关文档:翻译渠道出错分析与解决...220.246* Posted at: 2 months ago -
#4261 TaskCfgVTT(is_cuda=True, uuid='b0494ae0f9', cache_folder='D:/sp/tmp/2960/b0494ae0f9', target_dir='D:/B/_video_out/[email protected]_8K-mp4', source_language='日语', source_l...
💬 1[Last reply:2 months ago] 该错误表示 HuggingFace_ASR 模型 reazon-research/japanese-wav2vec2-large-rs35kh 未能从输入音频中识别出任何语音内容。请按以下步骤排查:检查模型是否已正确下载 在软件根目录 D:/sp/models 下查找是否存在 models--reazon-research--japanese-wav2vec2-large-rs35kh 文件夹,...240e:39e* Posted at: 2 months ago -
#4260 TaskCfgSTT(is_cuda=True, uuid='2bac82af4f', cache_folder='C:/pyVideoTrans/tmp/38804/2bac82af4f', target_dir='C:/pyVideoTrans/output/recogn', source_language=None, source_language_c...
💬 1[Last reply:2 months ago] 这是由于将软件安装在了系统盘(C盘)且文件路径/名称包含中文和特殊符号,导致权限不足或路径过长。解决方案:移动软件到非系统盘:将整个 pyVideoTrans 文件夹剪切到其他磁盘(如 D:\pyVideoTrans),路径确保纯英文无空格。简化输入文件:将源视频 066-S1-2苏州16.10.13道德经66章MAH00107.MP4 重命名为简短英文名(如 video1.mp4),并存放在浅层...67.159* Posted at: 2 months ago -
#4258 The above exception was the direct cause of the following exception:Traceback (most recent call last): File "videotrans......
💬 1[Last reply:2 months ago] 这是由于 sherpa_onnx 库版本不匹配或文件损坏导致的,通常发生在覆盖升级补丁包后或使用了不完整的完整包。解决方案:重新下载完整包并覆盖:前往 下载页面 下载最新的完整软件包(非补丁包),解压后覆盖到现有目录(或解压到新路径),确保 _internal/sherpa_onnx/ 目录是完整的。更改分离背景声模型:若问题依旧,打开软件 → 菜单栏 工具/选项 → 高级选项 → 找到 分离背景...2409:8a1e* Posted at: 2 months ago -
#4256 翻译后的字幕修改无效...
💬 3[Last reply:2 months ago] 你在“校对配音”界面修改了中文文字,但最终结果显示的是默认配字,这通常是因为修改后没有正确触发重新配音或保存。请按以下步骤排查:确认保存操作:在校对配音窗口中,修改文字后,必须点击窗口右下角的 “保存修改” 按钮(或类似绿色对勾/确定按钮),然后等待软件自动重新为当前字幕生成配音。直接关闭窗口不会保存修改。检查是否重新配音:修改保存后,软件会自动为修改过的字幕重新调用配音渠道生成新的语音片段。如果...2409:8a1e* Posted at: 2 months ago -
#4257 原视频的音频比特率是192kbps,翻译后生成的视频,音频比特率却变成了122kbps,声音明显变小了,怎么才能保持音量大小不变?...
💬 1[Last reply:2 months ago] 音量大小变化不是由比特率直接导致的,比特率降低通常不会使音量变小(可能只是细节损失),但你的情况感到声音变小,很可能是因为软件在重新编码音频时采用了不同的音量归一化处理或默认编码参数。解决方案:增大音量补偿:在主界面「设置更多参数...」中,将「音量+」参数调高(例如 +50% 或 +80%),直接提升最终配音音量。自定义音频编码参数:在「菜单-工具-高级选项-视频输出控制」中,找到「自定义ffm...2409:8a1e* Posted at: 2 months ago -
#4255 TaskCfgVTT(is_cuda=True, uuid='6dcede9748', cache_folder='G:/win-pyvideotrans-v3.99-420/tmp/16724/6dcede9748', target_dir='G:/VideoCaptioner/work-dir/output/DSVR-027-wav', source_l...
💬 1[Last reply:2 months ago] 该错误是 HuggingFace ASR 管道在处理批次数据时,因不同样本缺少 num_frames 键而导致批处理失败。这通常由模型/transformers 库版本不兼容或音频预处理异常引发。解决方案:切换为更稳定的识别渠道:建议改用 faster-whisper(本地) 并选择 large-v3 模型,该渠道更成熟、错误更少。若必须使用 HuggingFace_ASR:打开 菜单→工具→高级...101.204* Posted at: 2 months ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.
Dondate: ko-fi.com/jianchang512