-
#3964 中英双字怎么做...
💬 1[Last reply:1 month ago] 中英双字幕(双字幕)可以通过在“嵌入字幕”选项中选择“双硬字幕”或“双软字幕”来实现。具体操作步骤如下:在软件主界面,完成视频选择、语音识别、翻译和配音等设置。在“嵌入字幕”一行,点击下拉菜单。选择“嵌入硬字幕(双)”或“嵌入软字幕(双)”。嵌入硬字幕(双):将中英文字幕永久“烧录”到视频画面中,在任何播放器都会显示,无法关闭。嵌入软字幕(双):将中英文字幕作为独立轨道封装进视频文件,播放器(如P...2409:8a55* Posted at: 1 month ago -
#3962 ModuleNotFoundError: No module named 'torch'...
💬 1[Last reply:1 month ago] 这是由于Python环境中缺少PyTorch库导致的。软件在启动时尝试检查CUDA加速环境,但未能导入必需的torch模块。解决方案:请确保您是通过源码部署运行,而非Windows预打包版。预打包版应已包含所有依赖,不应出现此错误。如果您是源码运行,请使用uv包管理器在项目根目录下重新同步依赖:uv sync如果上述命令无效,可以尝试手动安装PyTorch(请确保CUDA版本为12.8):uv p...103.172* Posted at: 1 month ago -
#3961 ten-vad和Silero的区别...
💬 1[Last reply:1 month ago] VAD(语音活动检测)用于在语音识别前切分音频,区分语音段和静音/噪音段。ten-vad 和 silero 是两种不同的 VAD 模型,主要区别在于性能和资源消耗。区别与选择建议:ten-vad:基于 Tencent 的 VAD 模型,对中文语音的检测效果通常更好,更准确。silero:一个通用的 VAD 模型,支持多种语言,在非中文场景下表现良好,资源消耗相对较低。如何选择:如果您的原始视频是中...2409:8a55* Posted at: 1 month ago -
#3960 TaskCfgVTT(is_cuda=True, uuid='49eb0faa0d', cache_folder='G:/VideoTrans/tmp/2536/49eb0faa0d', target_dir='D:/Bl tuatriol/A Z Guide/4 - Chapter 4 Advanced Animation/04/71. 04_01 Wal...
💬 1[Last reply:1 month ago] 这是由于显存或内存不足导致的。错误信息明确指出在使用 faster-whisper(本地) 的 large-v3-turbo 模型时,GPU0 的显存或系统内存不足,导致进程池崩溃。解决方案:降低模型大小:将语音识别模型从 large-v3-turbo 更换为更小的模型,例如 medium、small 或 base。large-v3-turbo 模型对显存要求较高。调整高级设置:在菜单栏 工具/选...119.123* Posted at: 1 month ago -
#3959 ConnectionAbortedError: [WinError 10053] An established connection was aborted by the software in your host machine...
💬 1[Last reply:1 month ago] This error is caused by an unstable network connection or interruption during the use of the Google Speech Recognition service.The error log indicates that the connection was aborted (ConnectionAborte...103.49* Posted at: 1 month ago -
#3958 [DEBUG] [job] 进入执行语音识别阶段 trk.cfg=TaskCfgSTT(is_cuda=True, uuid='de5511f6aa', cache_folder='E:/videoTrans/tmp/19044/de551......
💬 1[Last reply:1 month ago] 你选择了“Faster-Whisper-XXL”语音识别渠道,但该渠道无法在Windows预打包版(.exe)中直接使用。根据日志错误信息 当前Faster-Whisper-XXL无法在打包版中使用,请源码部署或单独使用Faster-Whisper-XXL转录,这是软件的限制。Faster-Whisper-XXL是一个独立的可执行文件,与打包版的pyVideoTrans存在兼容性问题。解决方案:更...2406:da14* Posted at: 1 month ago -
#3957 二次语音识别的原理是什么?...
💬 5[Last reply:1 month ago] 你描述的现象是二次识别过程中的典型问题,其根本原因在于语音识别模型的固有局限性和错误传导。核心原因分析:ASR模型的“听写”本质:二次识别使用的语音识别模型(如faster-whisper)本质上是“听音写字”。它根据配音音频的声学特征,独立地重新生成文字,不会参考或校对之前已有的字幕文本。同音/近音词混淆:中文中存在大量同音字(如“宏伟”与“红伟”)。当配音的发音清晰度、音调或模型本身的训练数据...2409:8a55* Posted at: 1 month ago -
#3956 TaskCfgSTS(is_cuda=False, uuid='72a7abc898', cache_folder=None, target_dir='D:/Udemy教程/Udemy - Godot 2D Academy Create a Brotato style game with Godot 4/6 - Enemy Attack Behavior',...
💬 1[Last reply:1 month ago] 这是由于 Google 翻译服务在中国大陆无法直接访问,且系统 SSL 证书可能存在问题导致的网络连接失败。配置网络代理:由于 Google 服务被屏蔽,必须使用代理。在主界面的“网络代理地址”文本框中,填入您的代理服务地址(例如 http://127.0.0.1:10808)。请确保代理服务已开启且端口正确。更换翻译渠道:如果您没有可用的代理,请更换为无需代理的翻译渠道。例如:微软翻译:同为免费...103.196* Posted at: 1 month ago -
#3955 requests.exceptions.ConnectionError: HTTPConnectionPool(host='127.0.0.1', port=9988): Max retries exceeded with url: / (Caused by NewConnectionError('<urllib3.connection.HTTPConnec...
💬 1[Last reply:1 month ago] 这是由于你使用的配音渠道(例如 F5-TTS、CosyVoice、ChatterBox 或自定义 TTS API)对应的本地服务没有启动或端口配置错误。错误信息显示软件尝试连接 127.0.0.1:9988 失败,这表明你选择的配音渠道需要依赖一个独立的本地 API 服务。解决方案:确认并启动外部 TTS 服务:根据你选择的配音渠道,找到对应的项目并按照其官方文档启动 API 服务。例如,如果你选...8.218* Posted at: 1 month ago -
#3954 Phần TTS của edge bạn thường gửi bao nhiêu luồng 1 lúc và khi gặp lỗi không tạo được bạn sẽ làm gì...
💬 1[Last reply:1 month ago] Edge-TTS 渠道默认的并发线程数较高,这可能导致微软服务器限流,从而出现 403 错误或生成静音文件。解决方案:调整并发设置:在软件顶部菜单栏,进入 工具/选项 -> 高级选项 -> 字幕配音调整 区域。将 EdgeTTS配音渠道配音并发数 设置为 1。将 配音后暂停秒 设置为 5 到 10 秒。将 EdgeTTS配音渠道失败重试次数 设置为一个合理的数值(如 3)。这样设置可以...2001:ee0* Posted at: 1 month ago -
#3953 TaskCfgSTS(is_cuda=False, uuid='72782cc35e', cache_folder=None, target_dir='D:/Download/win-pyvideotrans-v3.98-0401/output/translate', source_language=None, source_language_code='S...
💬 1[Last reply:1 month ago] The error "Insufficient Balance" indicates that the API key for the DeepSeek translation service has insufficient funds or credits to complete the request.To resolve this, you need to recharge your De...113.181* Posted at: 1 month ago -
#3952 requests.exceptions.HTTPError: 405 Client Error: Method Not Allowed for url: http://127.0.0.1:7860/...
💬 1[Last reply:1 month ago] 这是由于配置的 TTS API 地址不正确或服务未正确启动导致的。405 错误表示服务器拒绝了请求方法,通常是因为你配置的地址指向了错误的端点(例如,指向了 WebUI 的根路径,而非 API 路径)。解决方案:确认 TTS 服务已正确启动:确保你部署的 F5-TTS、CosyVoice 或 ChatterBox 等 TTS 服务正在运行,并且终端窗口没有关闭。检查并修正 API 地址:在 pyV...2409:8a0c* Posted at: 1 month ago -
#3951 语音识别阶段出错 [openai-whisper(本地)] 出错了,可能内存或显存不足A child process terminated abruptly, the process pool is not usable anymoreTr......
💬 1[Last reply:1 month ago] 这是由于显存或内存不足导致语音识别进程崩溃。解决方案:降低模型大小:将语音识别模型从 medium 更换为更小的 small 或 base 模型。调整高级设置:在菜单栏 工具/选项 -> 高级选项 中进行如下修改,以降低显存/内存占用:CUDA数据类型: 将 float32 改为 float16 或 int8。识别准确度beam_size: 将 5 改为 1。识别准确度best_of: 将 ...103.220* Posted at: 1 month ago -
#3950 TaskCfgSTT(is_cuda=True, uuid='9311075a3a', cache_folder='D:/Program Files/win-pyvideotrans/tmp/5748/9311075a3a', target_dir='D:/Program Files/win-pyvideotrans/output/recogn', sour...
💬 1[Last reply:1 month ago] 这是由于内存或显存不足导致的,即使使用了最小的 tiny 模型。解决方案:检查文件路径:你的软件安装路径 D:/Program Files/win-pyvideotrans 和视频路径 D:/Udemy教程/... 都包含中文和空格。这可能导致程序在调用底层进程时出现问题。请将软件解压到纯英文、无空格的路径(如 D:\pyVideoTrans),并将待处理的视频文件也移动到类似路径下。调整高级设置...103.196* Posted at: 1 month ago -
#3948 配音后一些符号的读音不正确...
💬 3[Last reply:1 month ago] 在pyVideoTrans中,无法在嵌入硬字幕时自动将“7杠Zip”还原为“7-Zip”。硬字幕是直接“烧录”到视频画面上的文字,字幕文本是什么,显示的就是什么。如果您需要最终视频画面显示为“7-Zip”,但配音读作“7杠Zip”,目前软件没有内置功能来实现这种“显示文本”与“配音文本”的分离。可行的替代方案如下:嵌入软字幕(推荐):选择“嵌入软字幕”而非“嵌入硬字幕”。软字幕作为独立轨道封装在视...103.172* Posted at: 1 month ago -
#1690 No CUDA detected. Check NVIDIA GPU/Drivers. See Help -> CUDA....
💬 7[Last reply:1 month ago] O erro "The model grok-beta does not exist" indica que o nome do modelo que você inseriu não foi reconhecido pela API do xAI. Isso geralmente acontece porque o nome do modelo está incorreto ou a API d...191.6* Posted at: 6 months ago -
#3949 requests.exceptions.HTTPError: 404 Client Error: Not Found for url: http://127.0.0.1:7860/apitts...
💬 1[Last reply:1 month ago] 这是由于配置的 F5-TTS 或类似本地 TTS 服务的 API 地址不正确或服务未启动导致的。确认服务状态:确保您已正确部署并启动了 F5-TTS、Spark-TTS 或 CosyVoice 等本地 TTS 服务,并且其 API 服务正在运行(通常在终端或命令行窗口中可见)。检查 API 地址:在 pyVideoTrans 中,进入 菜单 -> 翻译设置 -> F5-TTS(或您使用...2409:8a0c* Posted at: 1 month ago -
#3947 术语表有没有自动匹配大小写的用法?...
💬 1[Last reply:1 month ago] 术语表目前不支持自动匹配大小写或通配符。每个术语条目是精确匹配的,billboard 和 Billboard 被视为两个不同的词,需要分别定义。术语表在 pyVideoTrans 中的核心用法是:在“翻译术语表”文本框中,每行填写一个“原文=译文”的条目(例如 billboard=公告板)。翻译时,AI 模型会参考这些条目进行替换。关于声调标注(如“公4”表示四声),pyVideoTrans 的术...103.172* Posted at: 1 month ago -
#3946 Expecting value: line 1 column 1 (char 0):Traceback (most recent call last): File "videotrans\translator\_base.py", lin......
💬 1[Last reply:1 month ago] 这是由于翻译渠道的 API 响应不是有效的 JSON 格式导致的。通常是因为网络代理未正确配置、API 地址或密钥错误,或者服务端返回了非 JSON 内容(如 HTML 错误页面)。解决方案:检查网络代理:如果您使用的翻译服务(如 Google、OpenAI、Gemini)在国内无法直接访问,必须在主界面的“网络代理地址”中填写正确的代理地址(格式如 http://127.0.0.1:10808)...208.87* Posted at: 1 month ago -
#2806 语音识别阶段出错 [faster-whisper(本地)] 59.mp4没有识别出字幕,请检查是否包含人类说话声音,以及说话语言是否和你选择的原始语言匹配Traceback (most recent call last): File "v......
💬 3[Last reply:1 month ago] 在 v3.98 版本的“翻译视频或音频”主界面中,已移除了“自动检测 (auto)”选项。您需要在“发音语言”下拉列表中明确指定视频中人声的实际语言(如“韩语”)。如果您不确定视频的语言,或者仅想进行语音转字幕,请使用软件左侧功能面板中的“批量语音转字幕”功能,该功能面板的“发音语言”选项中包含“自动检测”。请查阅相关文档:语音识别渠道说明与介绍...155.117* Posted at: 4 months ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.