-
#3957 二次语音识别的原理是什么?...
💬 5[Last reply:2 months ago] 你描述的现象是二次识别过程中的典型问题,其根本原因在于语音识别模型的固有局限性和错误传导。核心原因分析:ASR模型的“听写”本质:二次识别使用的语音识别模型(如faster-whisper)本质上是“听音写字”。它根据配音音频的声学特征,独立地重新生成文字,不会参考或校对之前已有的字幕文本。同音/近音词混淆:中文中存在大量同音字(如“宏伟”与“红伟”)。当配音的发音清晰度、音调或模型本身的训练数据...2409:8a55* Posted at: 2 months ago -
#3956 TaskCfgSTS(is_cuda=False, uuid='72a7abc898', cache_folder=None, target_dir='D:/Udemy教程/Udemy - Godot 2D Academy Create a Brotato style game with Godot 4/6 - Enemy Attack Behavior',...
💬 1[Last reply:2 months ago] 这是由于 Google 翻译服务在中国大陆无法直接访问,且系统 SSL 证书可能存在问题导致的网络连接失败。配置网络代理:由于 Google 服务被屏蔽,必须使用代理。在主界面的“网络代理地址”文本框中,填入您的代理服务地址(例如 http://127.0.0.1:10808)。请确保代理服务已开启且端口正确。更换翻译渠道:如果您没有可用的代理,请更换为无需代理的翻译渠道。例如:微软翻译:同为免费...103.196* Posted at: 2 months ago -
#3955 requests.exceptions.ConnectionError: HTTPConnectionPool(host='127.0.0.1', port=9988): Max retries exceeded with url: / (Caused by NewConnectionError('<urllib3.connection.HTTPConnec...
💬 1[Last reply:2 months ago] 这是由于你使用的配音渠道(例如 F5-TTS、CosyVoice、ChatterBox 或自定义 TTS API)对应的本地服务没有启动或端口配置错误。错误信息显示软件尝试连接 127.0.0.1:9988 失败,这表明你选择的配音渠道需要依赖一个独立的本地 API 服务。解决方案:确认并启动外部 TTS 服务:根据你选择的配音渠道,找到对应的项目并按照其官方文档启动 API 服务。例如,如果你选...8.218* Posted at: 2 months ago -
#3954 Phần TTS của edge bạn thường gửi bao nhiêu luồng 1 lúc và khi gặp lỗi không tạo được bạn sẽ làm gì...
💬 1[Last reply:2 months ago] Edge-TTS 渠道默认的并发线程数较高,这可能导致微软服务器限流,从而出现 403 错误或生成静音文件。解决方案:调整并发设置:在软件顶部菜单栏,进入 工具/选项 -> 高级选项 -> 字幕配音调整 区域。将 EdgeTTS配音渠道配音并发数 设置为 1。将 配音后暂停秒 设置为 5 到 10 秒。将 EdgeTTS配音渠道失败重试次数 设置为一个合理的数值(如 3)。这样设置可以...2001:ee0* Posted at: 2 months ago -
#3953 TaskCfgSTS(is_cuda=False, uuid='72782cc35e', cache_folder=None, target_dir='D:/Download/win-pyvideotrans-v3.98-0401/output/translate', source_language=None, source_language_code='S...
💬 1[Last reply:2 months ago] The error "Insufficient Balance" indicates that the API key for the DeepSeek translation service has insufficient funds or credits to complete the request.To resolve this, you need to recharge your De...113.181* Posted at: 2 months ago -
#3952 requests.exceptions.HTTPError: 405 Client Error: Method Not Allowed for url: http://127.0.0.1:7860/...
💬 1[Last reply:2 months ago] 这是由于配置的 TTS API 地址不正确或服务未正确启动导致的。405 错误表示服务器拒绝了请求方法,通常是因为你配置的地址指向了错误的端点(例如,指向了 WebUI 的根路径,而非 API 路径)。解决方案:确认 TTS 服务已正确启动:确保你部署的 F5-TTS、CosyVoice 或 ChatterBox 等 TTS 服务正在运行,并且终端窗口没有关闭。检查并修正 API 地址:在 pyV...2409:8a0c* Posted at: 2 months ago -
#3951 语音识别阶段出错 [openai-whisper(本地)] 出错了,可能内存或显存不足A child process terminated abruptly, the process pool is not usable anymoreTr......
💬 1[Last reply:2 months ago] 这是由于显存或内存不足导致语音识别进程崩溃。解决方案:降低模型大小:将语音识别模型从 medium 更换为更小的 small 或 base 模型。调整高级设置:在菜单栏 工具/选项 -> 高级选项 中进行如下修改,以降低显存/内存占用:CUDA数据类型: 将 float32 改为 float16 或 int8。识别准确度beam_size: 将 5 改为 1。识别准确度best_of: 将 ...103.220* Posted at: 2 months ago -
#3950 TaskCfgSTT(is_cuda=True, uuid='9311075a3a', cache_folder='D:/Program Files/win-pyvideotrans/tmp/5748/9311075a3a', target_dir='D:/Program Files/win-pyvideotrans/output/recogn', sour...
💬 1[Last reply:2 months ago] 这是由于内存或显存不足导致的,即使使用了最小的 tiny 模型。解决方案:检查文件路径:你的软件安装路径 D:/Program Files/win-pyvideotrans 和视频路径 D:/Udemy教程/... 都包含中文和空格。这可能导致程序在调用底层进程时出现问题。请将软件解压到纯英文、无空格的路径(如 D:\pyVideoTrans),并将待处理的视频文件也移动到类似路径下。调整高级设置...103.196* Posted at: 2 months ago -
#3948 配音后一些符号的读音不正确...
💬 3[Last reply:2 months ago] 在pyVideoTrans中,无法在嵌入硬字幕时自动将“7杠Zip”还原为“7-Zip”。硬字幕是直接“烧录”到视频画面上的文字,字幕文本是什么,显示的就是什么。如果您需要最终视频画面显示为“7-Zip”,但配音读作“7杠Zip”,目前软件没有内置功能来实现这种“显示文本”与“配音文本”的分离。可行的替代方案如下:嵌入软字幕(推荐):选择“嵌入软字幕”而非“嵌入硬字幕”。软字幕作为独立轨道封装在视...103.172* Posted at: 2 months ago -
#1690 No CUDA detected. Check NVIDIA GPU/Drivers. See Help -> CUDA....
💬 7[Last reply:2 months ago] O erro "The model grok-beta does not exist" indica que o nome do modelo que você inseriu não foi reconhecido pela API do xAI. Isso geralmente acontece porque o nome do modelo está incorreto ou a API d...191.6* Posted at: 6 months ago -
#3949 requests.exceptions.HTTPError: 404 Client Error: Not Found for url: http://127.0.0.1:7860/apitts...
💬 1[Last reply:2 months ago] 这是由于配置的 F5-TTS 或类似本地 TTS 服务的 API 地址不正确或服务未启动导致的。确认服务状态:确保您已正确部署并启动了 F5-TTS、Spark-TTS 或 CosyVoice 等本地 TTS 服务,并且其 API 服务正在运行(通常在终端或命令行窗口中可见)。检查 API 地址:在 pyVideoTrans 中,进入 菜单 -> 翻译设置 -> F5-TTS(或您使用...2409:8a0c* Posted at: 2 months ago -
#3947 术语表有没有自动匹配大小写的用法?...
💬 1[Last reply:2 months ago] 术语表目前不支持自动匹配大小写或通配符。每个术语条目是精确匹配的,billboard 和 Billboard 被视为两个不同的词,需要分别定义。术语表在 pyVideoTrans 中的核心用法是:在“翻译术语表”文本框中,每行填写一个“原文=译文”的条目(例如 billboard=公告板)。翻译时,AI 模型会参考这些条目进行替换。关于声调标注(如“公4”表示四声),pyVideoTrans 的术...103.172* Posted at: 2 months ago -
#3946 Expecting value: line 1 column 1 (char 0):Traceback (most recent call last): File "videotrans\translator\_base.py", lin......
💬 1[Last reply:2 months ago] 这是由于翻译渠道的 API 响应不是有效的 JSON 格式导致的。通常是因为网络代理未正确配置、API 地址或密钥错误,或者服务端返回了非 JSON 内容(如 HTML 错误页面)。解决方案:检查网络代理:如果您使用的翻译服务(如 Google、OpenAI、Gemini)在国内无法直接访问,必须在主界面的“网络代理地址”中填写正确的代理地址(格式如 http://127.0.0.1:10808)...208.87* Posted at: 2 months ago -
#2806 语音识别阶段出错 [faster-whisper(本地)] 59.mp4没有识别出字幕,请检查是否包含人类说话声音,以及说话语言是否和你选择的原始语言匹配Traceback (most recent call last): File "v......
💬 3[Last reply:2 months ago] 在 v3.98 版本的“翻译视频或音频”主界面中,已移除了“自动检测 (auto)”选项。您需要在“发音语言”下拉列表中明确指定视频中人声的实际语言(如“韩语”)。如果您不确定视频的语言,或者仅想进行语音转字幕,请使用软件左侧功能面板中的“批量语音转字幕”功能,该功能面板的“发音语言”选项中包含“自动检测”。请查阅相关文档:语音识别渠道说明与介绍...155.117* Posted at: 5 months ago -
#3945 TaskCfgVTT(is_cuda=True, uuid='83b594a021', cache_folder='D:/pyvideotran/tmp/23044/83b594a021', target_dir='E:/1/_video_out/NACT-055-mp4', source_language='日语', source_language_cod...
💬 1[Last reply:2 months ago] 这是由于显存或内存不足导致语音识别进程崩溃。根据错误信息,你使用的是 openai-whisper(本地) 的 large-v3-turbo 模型,并启用了 CUDA 加速。该模型对显存和内存要求较高,当资源不足时,子进程会异常终止,导致 BrokenProcessPool 错误。请按以下步骤尝试解决:降低模型大小:将语音识别模型从 large-v3-turbo 更换为更小的模型,例如 mediu...117.81* Posted at: 2 months ago -
#3944 requests.exceptions.ProxyError: HTTPSConnectionPool(host='translate.google.com', port=443): Max retries exceeded with url: /m?sl=en&tl=zh-cn&hl=zh-cn&q=You%20know%20what%20time%20i...
💬 1[Last reply:2 months ago] 这是由于网络代理设置错误或代理服务未启动导致的。错误信息显示软件尝试通过代理连接 Google 翻译服务,但代理服务器(目标计算机)拒绝了连接。解决方案:检查您的代理服务(如 VPN 或代理客户端)是否已正确启动并运行。如果您没有可用的代理服务,或者代理服务已关闭,请清空软件主界面“网络代理地址”文本框中的内容。如果您有可用的代理服务,请确认其地址和端口号,并确保在“网络代理地址”文本框中填写的格...2409:8918* Posted at: 2 months ago -
#3943 parallel_for failed: cudaErrorNoKernelImageForDevice: no kernel image is available for execution on the device...
💬 1[Last reply:2 months ago] This error indicates that the CUDA kernel images are not compatible with your specific NVIDIA GPU model. The software's built-in CUDA 12.8 libraries do not contain a kernel compiled for your GPU's com...191.6* Posted at: 2 months ago -
#3942 语音识别阶段出错 [openai-whisper(本地)] Traceback (most recent call last): File "videotrans\process\stt_fun.py", line 63, in open......
💬 1[Last reply:2 months ago] 这是由于 openai-whisper 模型文件下载不完整或损坏,导致 SHA256 校验失败。解决方案:手动清理并重新下载模型:关闭 pyVideoTrans 软件。前往软件安装目录下的 models 文件夹。找到并删除与 openai-whisper 相关的模型文件夹(例如,名称包含 whisper- 的文件夹)。重新启动软件,在语音识别阶段选择 openai-whisper(本地),软件会尝...60.179* Posted at: 2 months ago -
#3941 请将音频文件存放在 D:/pyvideotrans/f5-tts 目录下...
💬 11[Last reply:2 months ago] 填写 en01.wav#文字内容...123.110* Posted at: 2 months ago -
#3940 Phần mềm hiện tại đang làm chậm video bằng model nào...
💬 3[Last reply:2 months ago] Phần mềm sử dụng bộ lọc setpts của FFmpeg. Lệnh cốt lõi có dạng -filter:v "setpts=PTS*[hệ_số]" để kéo dài thời gian hiển thị của mỗi khung hình. Hệ số làm chậm được tính toán tự động dựa trê...2001:ee0* Posted at: 2 months ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.
Dondate: ko-fi.com/jianchang512