-
#3540 实时语音转文字怎么使用ollama作为翻译引擎?为什么找不到切换翻译引擎的入口,是v3.92这个版本没有这个功能吗?...
💬 1[Last reply:2 hours ago] 你的问题涉及两个部分:一是实时语音转文字功能如何使用 Ollama 作为翻译引擎,二是在 v3.92 版本中找不到切换翻译引擎的入口。关于实时语音转文字功能:根据核心知识库,pyVideoTrans 的“实时语音转文字”功能(如果存在)主要用于语音转录(ASR),其核心是将语音实时转换为文字,通常不涉及翻译环节。翻译功...223.73* Posted at: 2 hours ago -
#3539 TaskCfgTTS(is_cuda=True, uuid='140aae877e', cache_folder='D:/pyvideotrans/win-pyvideotrans-v3.97/tmp/13600/140aae877e', ...
💬 1[Last reply:6 hours ago] 该错误是由于 Qwen3-TTS(本地) 配音渠道的 API 服务未正确启动或连接失败导致的。解决方案:确认 Qwen3-TTS 服务已启动:确保你已按照官方文档部署了 Qwen-TTS 的 API 服务(例如,通过 python app.py 启动了一个 WebUI 服务)。服务通常运行在 http://127.0....156.226* Posted at: 6 hours ago -
#3538 OSError: cannot load library '/Users/wulinye/Desktop/project/pyvideotrans/.venv/lib/python3.10/site-packages/_soundfile_...
💬 1[Last reply:7 hours ago] 这是由于 macOS 系统缺少 libsndfile 音频库依赖导致的。安装 libsndfile:打开终端,使用 Homebrew 包管理器安装该库。如果尚未安装 Homebrew,请先访问 https://brew.sh 安装。在终端中执行命令:brew install libsndfile验证安装:安装完成后,重...141.11* Posted at: 7 hours ago -
#3537 TaskCfgSTT(is_cuda=True, uuid='8052205b4a', cache_folder='D:/program/win-videotrans/tmp/28032/8052205b4a', target_dir='C...
💬 1[Last reply:8 hours ago] 这是由于 faster-whisper 依赖的 tokenizers 库版本不兼容或损坏导致的。解决方案:清理并重新下载模型:关闭 pyVideoTrans 软件。进入软件安装目录下的 models 文件夹。删除与 faster-whisper 相关的模型文件夹(例如 models--Systran--faster-w...2409:8a1b* Posted at: 8 hours ago -
#3536 OSError: cannot load library '/Users/ruby/pyvideotrans/pyvideotrans/.venv/lib/python3.10/site-packages/_soundfile_data/l...
💬 3[Last reply:8 hours ago] 这是由于软件启动失败,无法通过常规方式重启。问题根源是缺少 libsndfile 库,导致 Python 模块 soundfile 在导入时崩溃,软件无法正常启动。解决方案:确保依赖已安装:在终端中执行 brew install libsndfile,确保命令成功执行,没有报错。激活虚拟环境并重装模块:打开终端,导航到...2409:8a55* Posted at: 8 hours ago -
#3535 为什么自定义翻译API的输入框,无法输入且删除里面的内容,...
💬 1[Last reply:8 hours ago] 这是由于 pyVideoTrans 软件界面中自定义翻译 API 输入框的文本被锁定为只读状态,无法直接编辑。解决方案:请点击输入框右侧的 “编辑” 按钮。点击后,输入框将解除锁定,允许您修改或删除其中的内容。修改完成后,点击 “保存” 按钮以应用更改。原因说明:该设计是为了防止用户误操作修改了预设的 API 请求模板...223.73* Posted at: 8 hours ago -
#3534 RuntimeError: Argument #4: Padding size should be less than the corresponding input dimension, but got: padding (2, 2) a...
💬 1[Last reply:12 hours ago] 该错误是由于使用 Qwen-TTS(本地) 进行声音克隆时,参考音频片段过短(或无效)导致模型无法提取有效的说话人嵌入特征。解决方案:确保参考音频长度合适:声音克隆需要 3-10 秒的清晰人声作为参考音频。请检查语音识别阶段生成的字幕片段时长。调整语音识别参数:打开 菜单 -> 工具 -> 高级选项。在 【...120.229* Posted at: 12 hours ago -
#3533 TaskCfgVTT(is_cuda=False, uuid='342bdc5d2a', cache_folder='D:/数字媒体/win-pyvideotrans-v3.97-0304/tmp/5424/342bdc5d2a', tar...
💬 1[Last reply:12 hours ago] 这是由于 faster-whisper(本地) 语音识别模型文件 model.bin 下载不完整或已损坏导致的。解决方案:手动下载并替换模型文件:根据你使用的模型 large-v3,在软件根目录下的 models 文件夹内,创建名为 models--Systran--faster-whisper-large-v3 的文...2409:895a* Posted at: 12 hours ago -
#3532 pyimod03_ctypes.install.<locals>.PyInstallerImportError: Failed to load dynlib/dll 'D:\\11\\_internal\\azure\\cognitives...
💬 1[Last reply:13 hours ago] 这是由于操作系统缺少必要的 VC++ 运行库,导致 Azure TTS 依赖的 DLL 文件无法加载。解决方案:下载并安装微软 VC++ 可再发行组件包。请访问以下链接下载并运行安装程序:微软VC++组件下载地址安装完成后,重启计算机。重新启动 pyVideoTrans 软件。如果问题仍然存在,请检查您下载的软件包是否...104.249* Posted at: 13 hours ago -
#3531 RuntimeError: File model.bin is incomplete: failed to read a buffer of size 13107200 at position 446498790...
💬 1[Last reply:14 hours ago] 这是由于 faster-whisper 模型文件 model.bin 下载不完整或已损坏导致的。解决方案:手动下载并替换模型文件:前往 HuggingFace 模型页面:https://huggingface.co/Systran/faster-whisper-large-v3/tree/main将该页面上的所有 .j...2408:8221* Posted at: 14 hours ago -
#3530 怎么设置没人讲话时不显示字幕,而不是那个字幕从头到尾一直挂着...
💬 1[Last reply:16 hours ago] 要实现“没人讲话时不显示字幕”,即字幕仅在说话时出现,需要确保字幕文件的时间轴与语音片段精确对齐。这主要取决于语音识别(ASR)步骤的准确性。核心原因:字幕时间轴不精确,导致静音部分也显示了字幕。解决方案:优化语音识别参数:在软件主界面,点击“设置更多参数...”。在“语音识别参数”区域,调整以下关键设置:语音阈值:适...120.236* Posted at: 16 hours ago -
#3529 字幕识别完就自动下载,字幕栏清空了,没有记录...
💬 1[Last reply:18 hours ago] 这是由于软件在语音识别完成后自动进入了翻译阶段,但翻译渠道配置可能存在问题(如未配置API Key或网络连接失败),导致翻译失败并清空了字幕栏。请按以下步骤排查:检查翻译渠道配置:确认你选择的翻译渠道(如 OpenAI、DeepSeek、Google 等)已正确配置。如果是需要 API Key 的渠道(如 OpenAI...38.90* Posted at: 18 hours ago -
#3528 画质砍半了啊怎么设置保留原画质啊...
💬 1[Last reply:20 hours ago] 视频输出画质下降通常是由于视频编码参数设置不当导致的。核心原因是软件默认的“视频输出质量控制”和“输出视频压缩率”参数为了平衡文件大小和速度,可能降低了画质。解决方案:打开软件,点击顶部菜单栏的“工具/选项” -> “高级选项”。在“视频输出控制”区域,找到以下两个参数进行调整:视频输出质量控制:将此值调低以提高...2409:8a50* Posted at: 20 hours ago -
#3527 未获取到角色列表=system:Windows-10-10.0.19045-SP0version:v3.97frozen:Truelanguage:zhroot_dir:C:/Users/Administrator/AppData/Loca...
💬 1[Last reply:20 hours ago] 这是由于 Edge-TTS 渠道在获取可用配音角色列表时网络连接失败导致的。解决方案:检查网络连接:确保你的计算机可以正常访问互联网,特别是能够连接到微软的 Edge-TTS 服务。调整高级设置:在软件顶部菜单栏,点击 工具/选项 -> 高级选项,在“字幕配音调整”区域,将 EdgeTTS配音渠道配音并发数 设为...188.253* Posted at: 20 hours ago -
#3526 RuntimeError: cuBLAS failed with status CUBLAS_STATUS_NOT_INITIALIZED...
💬 1[Last reply:1 day ago] 这是由于 CUDA 环境未正确初始化导致 cuBLAS 库调用失败。通常发生在 NVIDIA 显卡驱动、CUDA 或 cuDNN 版本不匹配或未正确安装时。解决方案:验证 CUDA 安装:打开命令提示符 (CMD),输入 nvcc -V 查看 CUDA 版本。pyVideoTrans 内置支持 CUDA 12.8。输入...144.48* Posted at: 1 day ago -
#3525 RuntimeError: File model.bin is incomplete: failed to read a buffer of size 3276800 at position 500134913...
💬 1[Last reply:1 day ago] 该错误是由于 faster-whisper 语音识别模型文件 model.bin 下载不完整或已损坏导致的。解决方案:手动下载并替换模型文件:根据你使用的模型(例如 large-v3),在软件根目录的 models 文件夹内,找到对应的模型文件夹(例如 models--Systran--faster-whisper-l...144.48* Posted at: 1 day ago -
#3524 HTTPSConnectionPool(host='translate.google.com', port=443): Max retries exceeded with url: /m?sl=zh-cn&tl=en&hl=en&q=%E4...
💬 1[Last reply:1 day ago] 这是由于网络代理配置错误或无法连接导致的。错误信息表明软件尝试通过代理访问 Google 翻译时,代理服务器(目标计算机)拒绝了连接。解决方案:检查代理设置:在软件主界面的“网络代理”输入框中,确认你填写的代理地址和端口是否正确且有效。格式应为 http://代理IP:端口 或 socks5://代理IP:端口。测试代...154.3* Posted at: 1 day ago -
#3522 文件或数据解码失败,编码格式错误:invalid start byte...
💬 7[Last reply:1 day ago] 这是由于网络限制导致无法访问 HuggingFace 官网。核心解决方案是使用国内镜像站下载模型文件,或通过配置网络代理让软件自动下载。解决方案:使用国内镜像站手动下载:访问 HuggingFace 国内镜像站:https://hf-mirror.com/mobiuslabsgmbh/faster-whisper-la...2409:8a55* Posted at: 1 day ago -
#3523 TaskCfgVTT(is_cuda=True, uuid='55d7490ad5', cache_folder='D:/videotrans/tmp/5612/55d7490ad5', target_dir='/dengking/nsfs...
💬 1[Last reply:1 day ago] 这是由于 HuggingFace_ASR 语音识别渠道依赖的 transformers 库版本与 tokenizers 库版本不兼容导致的。错误信息显示需要 tokenizers>=0.22.0,<=0.23.0,但当前环境中的版本是 tokenizers==0.20.1。解决方案:更新依赖库:由于您使用的...208.87* Posted at: 1 day ago -
#3521 HTTPSConnectionPool(host='translate.google.com', port=443): Max retries exceeded with url: /m?sl=yue&tl=en&hl=en&q=%E5%A...
💬 1[Last reply:1 day ago] 这是由于网络代理配置问题,导致软件无法连接到 Google 翻译服务。根据错误信息 HTTPSConnectionPool(host='translate.google.com', port=443): Max retries exceeded 和 Failed to establish a new...2409:8a28* Posted at: 1 day ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.