-
#3966 恢复标题有什么用...
💬 1[Last reply:3 hours ago] “恢复标题”功能用于在语音识别后,尝试为识别出的文本自动添加标点符号,使其更符合书面阅读习惯,提高字幕的可读性。请查阅相关文档:恢复标点...2409:8a55* Posted at: 3 hours ago -
#3965 ở TTS của edge ứng dụng có gửi 1 lúc 4 request không hay gửi từng cái rồi delay rồi gửi tiếp...
💬 1[Last reply:3 hours ago] Edge-TTS 渠道默认会并发发送多个请求以加快处理速度,这可能导致触发微软服务器的限流机制,从而返回 403 错误或生成静音文件。要改为逐个发送并延迟,请按以下步骤调整设置:打开软件,点击顶部菜单栏的 工具 -> 高级选项。在“字幕配音调整”区域,找到 并发配音线程数,将其值设为 1。在同一区域,找到 配音后...2001:ee0* Posted at: 3 hours ago -
#3964 中英双字怎么做...
💬 1[Last reply:3 hours ago] 中英双字幕(双字幕)可以通过在“嵌入字幕”选项中选择“双硬字幕”或“双软字幕”来实现。具体操作步骤如下:在软件主界面,完成视频选择、语音识别、翻译和配音等设置。在“嵌入字幕”一行,点击下拉菜单。选择“嵌入硬字幕(双)”或“嵌入软字幕(双)”。嵌入硬字幕(双):将中英文字幕永久“烧录”到视频画面中,在任何播放器都会显示,...2409:8a55* Posted at: 3 hours ago -
#3963 在不启用语音加速的前题下,如果英文翻译国语后,时间超出了,会怎样协调超时语音和后续的语音时间?...
💬 7[Last reply:3 hours ago] 在单视频交互模式下,不能直接添加、删除或分割字幕,是因为该模式的设计定位是“校对与微调”,而非“字幕编辑器”。其核心功能是在语音识别、翻译、配音这三个关键节点后,提供一个快速预览和修正结果的界面,主要操作集中在:预览和编辑识别出的字幕文本内容。预览和编辑翻译后的字幕文本内容。试听和重新生成单句配音。调整单句配音的开始/...2409:8a55* Posted at: 3 hours ago -
#3962 ModuleNotFoundError: No module named 'torch'...
💬 1[Last reply:4 hours ago] 这是由于Python环境中缺少PyTorch库导致的。软件在启动时尝试检查CUDA加速环境,但未能导入必需的torch模块。解决方案:请确保您是通过源码部署运行,而非Windows预打包版。预打包版应已包含所有依赖,不应出现此错误。如果您是源码运行,请使用uv包管理器在项目根目录下重新同步依赖:uv sync如果上述命...103.172* Posted at: 4 hours ago -
#3961 ten-vad和Silero的区别...
💬 1[Last reply:4 hours ago] VAD(语音活动检测)用于在语音识别前切分音频,区分语音段和静音/噪音段。ten-vad 和 silero 是两种不同的 VAD 模型,主要区别在于性能和资源消耗。区别与选择建议:ten-vad:基于 Tencent 的 VAD 模型,对中文语音的检测效果通常更好,更准确。silero:一个通用的 VAD 模型,支持多...2409:8a55* Posted at: 4 hours ago -
#3960 TaskCfgVTT(is_cuda=True, uuid='49eb0faa0d', cache_folder='G:/VideoTrans/tmp/2536/49eb0faa0d', target_dir='D:/Bl tuatriol...
💬 1[Last reply:6 hours ago] 这是由于显存或内存不足导致的。错误信息明确指出在使用 faster-whisper(本地) 的 large-v3-turbo 模型时,GPU0 的显存或系统内存不足,导致进程池崩溃。解决方案:降低模型大小:将语音识别模型从 large-v3-turbo 更换为更小的模型,例如 medium、small 或 base。l...119.123* Posted at: 6 hours ago -
#3959 ConnectionAbortedError: [WinError 10053] An established connection was aborted by the software in your host machine...
💬 1[Last reply:6 hours ago] This error is caused by an unstable network connection or interruption during the use of the Google Speech Recognition service.The error log indicates that the ...103.49* Posted at: 6 hours ago -
#3958 [DEBUG] [job] 进入执行语音识别阶段 trk.cfg=TaskCfgSTT(is_cuda=True, uuid='de5511f6aa', cache_folder='E:/videoTrans/tmp/19044/de551...
💬 1[Last reply:9 hours ago] 你选择了“Faster-Whisper-XXL”语音识别渠道,但该渠道无法在Windows预打包版(.exe)中直接使用。根据日志错误信息 当前Faster-Whisper-XXL无法在打包版中使用,请源码部署或单独使用Faster-Whisper-XXL转录,这是软件的限制。Faster-Whisper-XXL是一个...2406:da14* Posted at: 9 hours ago -
#3957 二次语音识别的原理是什么?...
💬 5[Last reply:10 hours ago] 你描述的现象是二次识别过程中的典型问题,其根本原因在于语音识别模型的固有局限性和错误传导。核心原因分析:ASR模型的“听写”本质:二次识别使用的语音识别模型(如faster-whisper)本质上是“听音写字”。它根据配音音频的声学特征,独立地重新生成文字,不会参考或校对之前已有的字幕文本。同音/近音词混淆:中文中存在...2409:8a55* Posted at: 10 hours ago -
#3885 TaskCfgVTT(is_cuda=True, uuid='da4e9f224c', cache_folder='D:/win-pyvideotrans-v3.98-323/tmp/13292/da4e9f224c', target_di...
💬 13[Last reply:10 hours ago] 要实现“同时并发4个任务,处理完一批再处理下一批”的批处理模式,软件没有内置的直接开关,但可以通过组合配置来近似实现。核心思路是限制GPU任务并发为1,但允许CPU任务(如翻译、合成)并行,并利用“强制串行”来控制整体流程。不过,由于语音识别(最耗GPU)是每个任务的第一阶段,如果4个任务同时开始,它们会竞争GPU导致...2a03:90c0* Posted at: 7 days ago -
#3956 TaskCfgSTS(is_cuda=False, uuid='72a7abc898', cache_folder=None, target_dir='D:/Udemy教程/Udemy - Godot 2D Academy Create a...
💬 1[Last reply:11 hours ago] 这是由于 Google 翻译服务在中国大陆无法直接访问,且系统 SSL 证书可能存在问题导致的网络连接失败。配置网络代理:由于 Google 服务被屏蔽,必须使用代理。在主界面的“网络代理地址”文本框中,填入您的代理服务地址(例如 http://127.0.0.1:10808)。请确保代理服务已开启且端口正确。更换翻译...103.196* Posted at: 11 hours ago -
#3955 requests.exceptions.ConnectionError: HTTPConnectionPool(host='127.0.0.1', port=9988): Max retries exceeded with url: / (...
💬 1[Last reply:11 hours ago] 这是由于你使用的配音渠道(例如 F5-TTS、CosyVoice、ChatterBox 或自定义 TTS API)对应的本地服务没有启动或端口配置错误。错误信息显示软件尝试连接 127.0.0.1:9988 失败,这表明你选择的配音渠道需要依赖一个独立的本地 API 服务。解决方案:确认并启动外部 TTS 服务:根据你...8.218* Posted at: 11 hours ago -
#3954 Phần TTS của edge bạn thường gửi bao nhiêu luồng 1 lúc và khi gặp lỗi không tạo được bạn sẽ làm gì...
💬 1[Last reply:11 hours ago] Edge-TTS 渠道默认的并发线程数较高,这可能导致微软服务器限流,从而出现 403 错误或生成静音文件。解决方案:调整并发设置:在软件顶部菜单栏,进入 工具/选项 -> 高级选项 -> 字幕配音调整 区域。将 EdgeTTS配音渠道配音并发数 设置为 1。将 配音后暂停秒 设置为 5 到 10 秒。将 ...2001:ee0* Posted at: 11 hours ago -
#3953 TaskCfgSTS(is_cuda=False, uuid='72782cc35e', cache_folder=None, target_dir='D:/Download/win-pyvideotrans-v3.98-0401/outp...
💬 1[Last reply:11 hours ago] The error "Insufficient Balance" indicates that the API key for the DeepSeek translation service has insufficient funds or credits to complete the request.To re...113.181* Posted at: 11 hours ago -
#3952 requests.exceptions.HTTPError: 405 Client Error: Method Not Allowed for url: http://127.0.0.1:7860/...
💬 1[Last reply:11 hours ago] 这是由于配置的 TTS API 地址不正确或服务未正确启动导致的。405 错误表示服务器拒绝了请求方法,通常是因为你配置的地址指向了错误的端点(例如,指向了 WebUI 的根路径,而非 API 路径)。解决方案:确认 TTS 服务已正确启动:确保你部署的 F5-TTS、CosyVoice 或 ChatterBox 等 ...2409:8a0c* Posted at: 12 hours ago -
#3951 语音识别阶段出错 [openai-whisper(本地)] 出错了,可能内存或显存不足A child process terminated abruptly, the process pool is not usable anymoreTr...
💬 1[Last reply:12 hours ago] 这是由于显存或内存不足导致语音识别进程崩溃。解决方案:降低模型大小:将语音识别模型从 medium 更换为更小的 small 或 base 模型。调整高级设置:在菜单栏 工具/选项 -> 高级选项 中进行如下修改,以降低显存/内存占用:CUDA数据类型: 将 float32 改为 float16 或 int8。识...103.220* Posted at: 12 hours ago -
#3950 TaskCfgSTT(is_cuda=True, uuid='9311075a3a', cache_folder='D:/Program Files/win-pyvideotrans/tmp/5748/9311075a3a', target...
💬 1[Last reply:12 hours ago] 这是由于内存或显存不足导致的,即使使用了最小的 tiny 模型。解决方案:检查文件路径:你的软件安装路径 D:/Program Files/win-pyvideotrans 和视频路径 D:/Udemy教程/... 都包含中文和空格。这可能导致程序在调用底层进程时出现问题。请将软件解压到纯英文、无空格的路径(如 D:\...103.196* Posted at: 12 hours ago -
#3948 配音后一些符号的读音不正确...
💬 3[Last reply:15 hours ago] 在pyVideoTrans中,无法在嵌入硬字幕时自动将“7杠Zip”还原为“7-Zip”。硬字幕是直接“烧录”到视频画面上的文字,字幕文本是什么,显示的就是什么。如果您需要最终视频画面显示为“7-Zip”,但配音读作“7杠Zip”,目前软件没有内置功能来实现这种“显示文本”与“配音文本”的分离。可行的替代方案如下:嵌入...103.172* Posted at: 15 hours ago -
#1690 No CUDA detected. Check NVIDIA GPU/Drivers. See Help -> CUDA....
💬 7[Last reply:15 hours ago] O erro "The model grok-beta does not exist" indica que o nome do modelo que você inseriu não foi reconhecido pela API do xAI. Isso geralmente acontece porque o ...191.6* Posted at: 4 months ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.