-
#4310 使用本地faster-whisper进行转录的时候可以租用云端GPU运行吗?...
💬 5[Last reply:1 month ago] 暂无法提供 AutoDL 的专项一键部署脚本,但您可参照 Linux 源码部署流程,在 AutoDL 实例中手动搭建环境。基本步骤如下:租用实例:在 AutoDL 选择含 NVIDIA 显卡、显存 ≥10GB(推荐 16G+)、预装 CUDA 12.8 的镜像,或租用后自行安装 CUDA 12.8 和 cuDNN 9.11+。安装依赖:打开终端,执行 apt update && a...5.34* Posted at: 1 month ago -
#4309 对音频翻译能把字幕嵌入音频吗,我分部处理翻译音频-音频与视频合并...
💬 3[Last reply:1 month ago] 知识库中未提供不同人声分离模型的效果对比与推荐。建议直接使用默认模型进行分离;如果效果不佳,可在 菜单 → 工具 → 高级选项 → 分离背景声模型 中切换其他模型测试。请查阅相关文档:分离人声和背景音...38.244* Posted at: 1 month ago -
#4308 TaskCfgSTT(is_cuda=True, uuid='793e70d1b5', cache_folder='E:/ytrans/tmp/13092/793e70d1b5', target_dir='E:/ytrans/output/recogn', source_language=None, source_language_code=None, so...
💬 1[Last reply:1 month ago] CUDA out of memory during faster-whisper speech recognition, because the large-v3-turbo model requires more VRAM than your GPU can provide (minimum ~8–10GB for this model, and yours is insufficient).S...202.150* Posted at: 1 month ago -
#4307 opening input: Invalid data found when processing input opening input file D:/win-pyvideotrans-v3.99-420/tmp/45072/srt1777245491.1324701.srt. opening input files: Invalid data foun...
💬 1[Last reply:1 month ago] 这是由于当前任务生成的字幕文件(SRT)损坏或格式不符合规范,导致 ffmpeg 在合成阶段无法读取。原因字幕可能包含乱码、格式错误,或在多线程处理时发生写入冲突,导致文件内容不完整。步骤如下强制重新处理:在软件主界面勾选 清理已生成 复选框,然后重新执行任务,强制丢弃旧缓存并重新生成字幕。检查字幕路径与长度:确保原视频存放在浅层目录(如 D:\video),文件名简短且不含特殊符号或中文。Win...2409:8a55* Posted at: 1 month ago -
#4306 decoding subtitles: Invalid data found when processing input number -1145393733 occurred) number -1145393733 occurred)...
💬 1[Last reply:1 month ago] 该错误通常是因为视频文件内嵌了非标准或损坏的字幕流,或者视频文件路径/名称包含特殊字符(如表情、空格)或过长,导致内部字幕解码失败。请按以下步骤排查:将视频文件移动到一个浅层、全英文短路径的目录(如 D:\temp),并将文件名改为简短的英文(如 test.mp4)。在软件主界面勾选 “清理已生成”,然后重新处理该视频。如果仍然失败,尝试在 “输出到...” 选择不嵌入任何字幕(即选择“不嵌入字幕...2409:8a55* Posted at: 1 month ago -
#4305 字幕位置为什么很不稳定...
💬 5[Last reply:1 month ago] 软字幕支持样式,但取决于封装格式和播放器。如 SRT 格式仅含纯文本,而 ASS/SSA 格式可携带字体、颜色、位置等样式信息。在 pyVideoTrans 中嵌入软字幕时,软件会将字幕转为 ASS 格式并封装,因此您可以像硬字幕一样在“修改硬字幕样式”编辑器中设置样式,效果会应用到软字幕中。不过,最终显示效果还需播放器支持 ASS 渲染(多数现代播放器均支持)。若您需要更稳定的位置控制,软字幕仍...2409:8a55* Posted at: 1 month ago -
#4304 ValueError: The elements of the batch contain different keys. Cannot batch them ({'attention_mask', 'input_features', 'is_last'} != {'attention_mask', 'num_frames', 'input_features...
💬 1[Last reply:1 month ago] 这个错误是由于 HuggingFace_ASR 语音识别渠道在处理音频时,数据批次(batch)中的元素键名不一致导致的。简单说,部分音频片段返回了 num_frames 字段,而其他片段没有,导致批处理失败。通常与音频长度差异过大、模型内部处理不一致或兼容性问题有关。解决方案:更换语音识别渠道:这是最直接的解决方法。推荐使用更稳定的 faster-whisper(本地) 并选择 large-v3...38.244* Posted at: 1 month ago -
#4303 日文语音转录用哪个模型,怎么样在选项界面设置,能使字幕字数最多...
💬 1[Last reply:1 month ago] 日文语音转录推荐使用 HuggingFace_ASR 渠道,选择针对日语优化的模型。要让生成的每一条字幕包含更多文字(减少断句),需要调整语音活动检测(VAD)相关参数。推荐模型免费本地模型:HuggingFace_ASR → 选择 kotoba-whisper(专为日语设计的 Whisper 微调模型)或 reazon-research/japanese-wav2vec2-large-rs35k...38.244* Posted at: 1 month ago -
#4302 无法连接当前api...
💬 1[Last reply:1 month ago] 无法连接API通常由网络问题、代理未设置或API密钥/地址配置错误引起。检查网络代理:如果你在中国大陆使用海外服务(Google、OpenAI、Gemini等),需要配置代理。在主界面“网络代理地址”填入 http://127.0.0.1:xxxx(xxxx为代理端口),留空默认直连。确认API地址和密钥:前往菜单栏对应的设置面板(如翻译设置、TTS设置),检查 Base URL 是否完整(例如 ...67.209* Posted at: 1 month ago -
#4301 TaskCfgSTT(is_cuda=True, uuid='5a504ecb90', cache_folder='D:/win-pyvideotrans-v3.99-420/tmp/11380/5a504ecb90', target_dir='D:/win-pyvideotrans-v3.99-420/output/recogn', source_lang...
💬 1[Last reply:1 month ago] Faster-Whisper-XXL 作为外部独立程序,在 PyInstaller 打包的 .exe 中运行时会因环境隔离、依赖缺失等原因无法正常调用。该渠道仅支持在源码部署下使用,或将其作为独立工具先转录出字幕再导入。解决方案(二选一)改用源码部署运行 pyVideoTrans按照官方文档 Mac/Linux 或 Windows 源码部署(需自行查阅)执行 uv sync 并启动 uv run ...38.135* Posted at: 1 month ago -
#4300 如何验证cuda和cuDNN是否已安装成功?...
💬 1[Last reply:1 month ago] 在 Windows 上验证 CUDA 和 cuDNN 是否成功安装,请打开命令提示符 (CMD) 并执行以下命令:检查 CUDA 版本 输入 nvcc -V,如果能显示比如 release 12.8 之类的版本信息,说明 CUDA 工具包已正确安装并可被系统找到。若提示“不是内部或外部命令”,则需确认 CUDA 的 bin 目录是否添加到了系统环境变量 PATH 中(通常为 C:\Program...2409:8a55* Posted at: 1 month ago -
#4299 urllib.error.URLError: <urlopen error Tunnel connection failed: 404 Not Found>...
💬 1[Last reply:1 month ago] 这是因网络代理配置错误导致的模型下载失败。软件通过代理连接时收到 404 响应,说明代理地址无效或代理服务未启动。解决方法:在主界面找到“网络代理地址”输入框。如果确实不需要代理,请清空该项(留空即可)。若必须使用代理,请确认代理服务已运行,且地址格式正确(如 http://127.0.0.1:10809),端口号需与你的代理客户端一致。修改后重新开始任务。请查阅相关文档:网络代理地址...188.253* Posted at: 1 month ago -
#4297 一直卡在分离人声...
💬 5[Last reply:1 month ago] 根据您的操作系统选择部署方式:Windows 重新部署下载完整包:从官网下载最新的 .7z 完整包(不要只下载补丁包)。解压到纯英文路径:例如 D:\pyVideoTrans,路径中不能包含中文、空格或特殊符号,也不要解压到 C:\Program Files 等需要管理员权限的目录。启动:进入解压目录,双击 sp.exe 即可。首次启动需等待几十秒加载模块。清理旧配置(可选):如果想彻底干净重装,...67.209* Posted at: 1 month ago -
#4296 TaskCfgTTS(is_cuda=True, uuid='6dd97c8122', cache_folder='C:/Users/rudra/Downloads/win-pyvideotrans-v3.99-420/tmp/66440/6dd97c8122', target_dir='C:/Users/rudra/Downloads/win-pyvide...
💬 1[Last reply:1 month ago] This error occurs when Edge-TTS fails to synthesize audio, usually due to rate limiting or incorrect parameters (e.g., unsupported voice/language combination). The Microsoft service may temporarily bl...103.37* Posted at: 1 month ago -
#4295 必须选择视频文件=system:Windows-10-10.0.26100-SP0version:v3.99frozen:Truelanguage:zhroot_dir:E:/软件下载/tss/win-pyvideotrans-v3.99-......
💬 1[Last reply:1 month ago] 这是由于所选文件路径可能包含特殊符号,或文件路径/名称过长触发了系统限制,导致软件未能正确识别为有效的视频文件输入。请按以下步骤排查:检查文件命名:确保视频文件名和存放路径中不含中文、表情符、空格或其他特殊符号(如 ?, *, @ 等)。缩短文件路径:Windows 系统对命令行长度有限制(通常约 200 字符)。请将视频文件移动到一个路径较浅的文件夹(例如 D:\videos),并将其重命名为简...2a09:bac1* Posted at: 1 month ago -
#4294 RuntimeError: 7f399ef109 split no voice error:while opening encoder - maybe incorrect parameters such as bit_rate, rate, width or height. sending frames to consumers: Generic error...
💬 1[Last reply:1 month ago] 这是由于 ffmpeg 编码器参数错误导致,通常与硬件编码兼容性问题有关。请尝试以下步骤:在菜单栏 工具/选项 -> 高级选项 -> 视频输出控制 中,勾选 强制软编码视频。这会让 ffmpeg 改用 CPU 软编码,避免硬件编码器参数不匹配,兼容性更好。确认原始视频的分辨率(宽、高)均为偶数,若为奇数,可用其他工具转换后再处理,否则编码器可能无法打开。尝试暂时不嵌入硬字幕,只生成配音...240e:39e* Posted at: 1 month ago -
#4293 videotrans.util.help_ffmpeg._FFprobeInternalError: [mov,mp4,m4a,3gp,3g2,mj2 @ 0000023d4f9775c0] moov atom not found D:/win-pyvideotrans-v3.99-420/tmp/8844/aadb998457/novoice.mp4: I...
💬 1[Last reply:1 month ago] 无声视频文件 novoice.mp4 损坏或不完整,导致 ffprobe 无法解析其时长(moov atom 缺失)。这通常是因为中间文件写入异常,可能由磁盘空间不足、临时文件夹路径过长或包含特殊符号、或处理过程意外中断引起。解决步骤:关闭软件,手动删除安装目录下的 tmp 文件夹内所有内容(或仅删除出错视频对应的 D:/win-pyvideotrans-v3.99-420/tmp/8844 目录...240e:39e* Posted at: 1 month ago -
#4292 RuntimeError: e4ed3dfd77 split no voice error:submitting packet to decoder: Cannot allocate memory while opening encoder - maybe incorrect parameters such as bit_rate, rate, width ...
💬 1[Last reply:1 month ago] 这是 FFmpeg 在合成视频时,因编码器内存分配失败导致的错误。直白点说,就是你电脑在最后一步“组装”翻译好的视频时,因为视频编码参数或分辨率等原因,内存炸了。请按以下步骤尝试解决:修改高级选项:打开软件顶部菜单栏的 工具/选项 -> 高级选项,找到 视频输出控制 区域,勾选 强制软编码视频?。降低编码器复杂度(可选):如果问题依旧,尝试将同一个设置区域内的 264/265编码 选项,从 ...2602:f6f6* Posted at: 1 month ago -
#4291 能否支持8K视频,265编码操作...
💬 1[Last reply:1 month ago] pyVideoTrans 支持 265 编码,您可以在 菜单-工具-高级选项-264/265编码 中选择 265。该软件通过调用 FFmpeg 进行编解码,理论上支持 8K 分辨率,但实际处理性能受限于您的硬件配置(尤其是 CPU/GPU 与内存)。8K 视频处理将消耗大量计算资源和时间,且可能因路径过长或临时文件过大导致失败。建议先将 8K 视频转换为更易处理的中间格式,或确保系统有足够的磁盘空...2602:f6f6* Posted at: 1 month ago -
#4290 TaskCfgVTT(is_cuda=True, uuid='51deecdac8', cache_folder='D:/pyvideotrans/tmp/1124/51deecdac8', target_dir='C:/Users/ab291/Desktop/test/_video_out/0420-mp4', source_language='日语', ...
💬 1[Last reply:1 month ago] 这是启用 CUDA 加速后,由于 CUDA 运行库版本与显卡驱动不兼容,或显卡架构过旧,导致 cuBLAS 运算失败引发的错误,常见于 50 系新显卡或未正确安装 CUDA 12.8 的环境。如果无法通过更新驱动解决,可在软件主界面取消勾选“CUDA 加速”,改用 CPU 处理(速度会变慢)。更新显卡驱动,访问 NVIDIA 官网下载并安装最新驱动。安装软件内置支持的 CUDA 12.8,并下载对...223.104* Posted at: 1 month ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.