-
#4056 TaskCfgSTT(is_cuda=True, uuid='2b80266086', cache_folder='F:/AI/win-pyvideotrans-v3.98-0408/win-pyvideotrans-v3.98-0408/tmp/10128/2b80266086', target_dir='F:/AI/win-pyvideotrans-v3...
💬 1[Last reply:2 months ago] 这是由于显存或内存不足导致的。在使用 faster-whisper(本地) 的 large-v3-turbo 模型进行语音识别时,模型需要较大的显存/内存,当资源不足时会导致进程崩溃。请按以下步骤尝试解决:使用更小的模型:将语音识别模型从 large-v3-turbo 更换为更小的模型,例如 medium、small 或 base。large-v3 系列模型最低需要约 10GB 显存。调整高级设置...112.118* Posted at: 2 months ago -
#4055 RuntimeError: This model is currently experiencing high demand. Spikes in demand are usually temporary. Please try again later....
💬 1[Last reply:2 months ago] This error is caused by the Gemini translation service being temporarily overloaded or rate-limited.Solution:Wait and Retry: The error message indicates the issue is temporary. Wait a few minutes and ...2402:800* Posted at: 2 months ago -
#4054 TaskCfgSTT(is_cuda=False, uuid='8e2042b6a9', cache_folder='E:/videotrans/win-pyvideotrans-v3.98-0410/tmp/24040/8e2042b6a9', target_dir='E:/videotrans/win-pyvideotrans-v3.98-0410/ou...
💬 1[Last reply:2 months ago] 这是由于文件路径过长或包含特殊字符,导致 ffmpeg 命令无法执行。缩短路径和文件名:将输入视频文件 k.mp4 移动到更浅的目录(例如 D:\ 或 E:\ 根目录),并确保路径中不包含中文、空格或特殊符号。建议使用纯英文或数字的简短文件名。检查软件安装路径:确保 pyVideoTrans 软件本身也安装在非系统盘(如 E:\pyVideoTrans)的浅层目录,路径同样不应包含中文或特殊符号。...216.195* Posted at: 2 months ago -
#4053 TaskCfgVTT(is_cuda=True, uuid='bd101f9a3f', cache_folder='E:/pyvideotrans-v3.98/tmp/9400/bd101f9a3f', target_dir='C:/Users/UserName/Desktop/CQB/_video_out/Real World CQB is Impossi...
💬 1[Last reply:2 months ago] 该错误是由于内存或显存不足,导致子进程崩溃,无法继续使用进程池。解决方案:检查是否启用了二次识别:如果同时翻译多个视频且启用了“二次识别”,前面视频的二次识别可能会和后面视频的第一次转录同时运行,导致需要2-3倍的显存。请先尝试在主界面右上角取消勾选“二次识别”选项后重试。降低模型大小:将 faster-whisper 的模型从 large-v3-turbo 更换为更小的模型,例如 medium、...103.197* Posted at: 2 months ago -
#4052 ValueError: The elements of the batch contain different keys. Cannot batch them ({'is_last', 'input_features', 'attention_mask'} != {'is_last', 'input_features', 'attention_mask', ...
💬 1[Last reply:2 months ago] 这是由于使用了 HuggingFace ASR 渠道时,模型或数据处理管道内部出现了批次数据键值不一致的错误。解决方案:切换语音识别渠道:暂时避免使用 HuggingFace_ASR 渠道。建议改用 faster-whisper(本地) 或 openai-whisper(本地) 渠道,并选择 large-v3 模型。检查模型选择:如果必须使用 HuggingFace 模型,请确保在 Hugging...114.32* Posted at: 2 months ago -
#4050 OmniVoice-TTS配置出错...
💬 3[Last reply:2 months ago] 该错误通常是由于 OmniVoice-TTS 的 API 服务端点(endpoint)路径与 pyVideoTrans 默认的请求路径不匹配造成的。OmniVoice-TTS 的 WebUI 和 API 服务可能使用了不同的端口或路径。解决方案:确认 API 服务地址:确保您启动的是 OmniVoice-TTS 的 API 服务,而不仅仅是 WebUI。查看您启动服务时的命令行输出,确认其提供的 ...182.105* Posted at: 2 months ago -
#4051 ValueError: Unsupported languages: ['Hindi']. Supported: ['auto', 'chinese', 'english', 'french', 'german', 'italian', 'japanese', 'korean', 'portuguese', 'russian', 'spanish']...
💬 1[Last reply:2 months ago] The error occurs because the Qwen-TTS (local) voice synthesis channel does not support the target language "Hindi" you selected. The channel only supports a limited set of languages: auto, chinese, en...103.16* Posted at: 2 months ago -
#4049 OmniVoice-TTS 配置面板中,找到“instruct”输入框...
💬 1[Last reply:2 months ago] 在 OmniVoice-TTS 的配置面板中,“instruct”输入框位于“角色”选择框的右侧。具体查找路径如下:点击软件主界面右上角的 菜单 -> 翻译设置。在弹出的设置窗口中,找到并点击 OmniVoice-TTS 标签页。在该标签页中,找到 “角色” 下拉选择框。“instruct”输入框就紧邻在“角色”选择框的右侧,用于输入自定义指令以微调音色。请查阅相关文档:OmniVoice-...182.105* Posted at: 2 months ago -
#4048 语音识别阶段出错 [Qwen-ASR(本地)] Try: pip install transformers -U or pip install -e '.[dev]' if you're working with git......
💬 1[Last reply:2 months ago] 这是由于 Qwen-ASR(本地) 渠道依赖的 tokenizers 库版本不兼容导致的。软件内置的 tokenizers 版本为 0.19.1,但 Qwen-ASR 需要版本在 0.22.0 到 0.23.0 之间。解决方案:临时方案(推荐):更换语音识别渠道。对于中文视频,可以尝试使用 faster-whisper(本地) 的 large-v3 模型,或 openai-whisper(本地) ...116.28* Posted at: 2 months ago -
#4047 TaskCfgTTS(is_cuda=False, uuid='2d863cd941', cache_folder='C:/peiyinruanjian/2/win-pyvideotrans-v3.98-0410/tmp/20928/2d863cd941', target_dir='C:/peiyinruanjian/2/win-pyvideotrans-v...
💬 1[Last reply:2 months ago] 这是由于你使用了 ElevenLabs 配音渠道的付费角色,但你的 ElevenLabs 账户是免费订阅,无法通过 API 使用其官方音库中的角色。解决方案:更换配音渠道或角色:在配音渠道中选择其他免费渠道(如 Edge-TTS)或 ElevenLabs 中明确标记为免费的克隆角色。升级 ElevenLabs 订阅:前往 ElevenLabs 官网升级你的账户为付费订阅,以解锁官方音库的 API ...148.135* Posted at: 2 months ago -
#4046 TaskCfg(cache_folder='D:/tts/tmp/7996/20059c023f', target_dir='E:/音频库/4.13/_video_out/1 (1)-mp4', remove_noise=False, is_separate=False, detect_language='en', subtitle_language=Non...
💬 1[Last reply:2 months ago] 这是由于网络代理设置不正确或代理服务不可用导致的。faster-whisper 在尝试从 HuggingFace 下载模型时,因代理问题而失败。解决方案:检查并修正代理设置:在主界面的“网络代理地址”文本框中,确认您填写的代理地址格式正确(例如 http://127.0.0.1:10808)。如果代理服务未运行或端口错误,请修正。关闭代理:如果您没有可用的代理服务,或不确定如何设置,请直接清空“网...1.161* Posted at: 2 months ago -
#4045 FileNotFoundError: [Errno 2] No such file or directory: 'ffmpeg'...
💬 1[Last reply:2 months ago] 这是由于 macOS 系统上缺少 FFmpeg 环境导致的。pyVideoTrans 依赖 FFmpeg 来处理音视频文件,而预打包的 macOS 版本可能不包含 FFmpeg。解决方案:打开终端(Terminal)。使用 Homebrew 安装 FFmpeg:brew install ffmpeg。安装完成后,重启 pyVideoTrans 软件。如果安装 Homebrew 后问题依旧,请确保 ...125.46* Posted at: 2 months ago -
#4044 videotrans.util.help_ffmpeg._FFprobeInternalError: [mov,mp4,m4a,3gp,3g2,mj2 @ 0000017d3c84d380] moov atom not found D:/BaiduNetdiskDownload/win-pyvideotrans-v3.98-0403/tmp/6244/051...
💬 3[Last reply:2 months ago] 错误核心原因是软件在音画对齐阶段,尝试读取临时生成的无声视频文件(novoice.mp4)时,发现该文件不完整或已损坏(moov atom not found),导致无法获取视频时长,进程中断。解决方案:强制重新处理:在主界面左上角勾选 清理已生成 复选框,然后重新执行翻译任务。这将清除所有缓存文件,强制软件重新生成所有中间文件。优化文件路径:确保你的原始视频文件路径(从盘符到文件名)不包含中文、...45.78* Posted at: 2 months ago -
#1320 ValueError: Requested float16 compute type, but the target device or backend do not support efficient float16 computation....
💬 11[Last reply:2 months ago] 问题核心是使用 large-v3 模型进行语音识别时,由于模型过大或系统资源不足,导致子进程异常终止。日志显示 is_cuda=False,说明已关闭CUDA加速,但CPU处理 large-v3 模型仍可能导致内存不足。请按以下步骤解决:更换更小的语音识别模型:在主界面的“语音识别”渠道中,将模型从 large-v3 更换为 medium 或 small。这是最直接有效的解决方案。调整高级选项中的...2401:c080* Posted at: 7 months ago -
#4043 卡在 STT use large-v3 starting......
💬 11[Last reply:2 months ago] 问题核心是 large-v3 模型在 CUDA 环境下初始化失败,导致进程卡死。虽然视频缩短,但模型加载阶段即出现问题。解决方案:验证 CUDA 环境:在 CMD 中运行 nvcc -V 和 nvidia-smi,确认 CUDA 版本为 12.8,且 4080 显卡驱动为最新。强制使用 CPU 模式测试:在主界面取消勾选“CUDA加速”,然后重新运行。如果 CPU 模式下能顺利通过“STT sta...1.160* Posted at: 2 months ago -
#4042 双语字幕如何调整字幕样式,比如我希望中文字幕字体大些,英文小些...
💬 5[Last reply:2 months ago] 在 v3.98 版本中,硬字幕样式编辑器确实只有一组样式设置,无法直接为双语字幕的两行分别设置不同样式。这是一个已知的功能限制。要实现中文字体大、英文字体小的效果,目前需要通过间接方法实现:生成双语字幕文件:使用软件正常完成视频翻译,并选择输出“双字幕”(例如“嵌入软字幕(双)”)。翻译完成后,在输出文件夹中找到生成的双语 .srt 字幕文件。使用外部字幕编辑软件调整样式:使用专业的字幕编辑软件(...2409:8a55* Posted at: 2 months ago -
#4041 requests.exceptions.ConnectionError: HTTPConnectionPool(host='127.0.0.1', port=9988): Max retries exceeded with url: /apitts (Caused by NewConnectionError('<urllib3.connection.HTTP...
💬 1[Last reply:2 months ago] 这是由于你使用了需要本地部署的配音渠道(例如 F5-TTS、CosyVoice、GPT-SoVITS、ChatterBox 等),但对应的本地服务没有启动或端口配置错误。解决方案:确认你使用的配音渠道:查看主界面“配音渠道”下拉列表中的选择。如果是 F5-TTS、CosyVoice、GPT-SoVITS、ChatterBox、Index-TTS 等,都需要先独立部署并启动其 API 服务。启动外部...5.34* Posted at: 2 months ago -
#4039 如何添加双语硬字幕,包括样式的调整,如中文字大小,英文字大小等...
💬 15[Last reply:2 months ago] 要使用 ass.json 文件设置双字幕样式,需要分别创建并配置原始语言和目标语言的字幕样式。操作步骤:定位配置文件:软件根目录下应存在 ass.json 文件。如果没有,可以在完成一次视频翻译并嵌入双字幕(硬或软)后,在输出文件夹或临时文件夹中找到生成的 ass.json 文件作为模板。理解结构:一个典型的双字幕 ass.json 文件应包含两个独立的样式块(Style),分别对应原始语言和目标...2409:8a55* Posted at: 2 months ago -
#4040 openai.InternalServerError: Error code: 503 - {'error': {'code': 'model_not_found', 'message': 'No available channel for model gpt-5.2-pro under group openai_azure (distributor) (r...
💬 1[Last reply:2 months ago] 这是由于在 Azure OpenAI 服务中请求了不存在的模型名称 gpt-5.2-pro 导致的。检查并修正模型名称:在软件菜单栏中,点击 翻译设置 -> OpenAI ChatGPT,检查 模型 输入框中的内容。Azure OpenAI 的模型名称通常为 gpt-4o、gpt-4-turbo 或 gpt-35-turbo 等,而不是 gpt-5.2-pro。确认模型部署:确保您在 Azu...2408:8207* Posted at: 2 months ago -
#4038 翻译术语表的原理是什么...
💬 1[Last reply:2 months ago] 翻译术语表用于在AI翻译环节,向翻译模型(如ChatGPT、DeepSeek等)提供特定的术语对照关系,强制AI在翻译时优先使用你指定的译法,以确保专业术语、品牌名、人名等翻译的一致性。原理:在调用AI翻译接口时,软件会将你填写的术语表内容(格式为源术语=目标术语)作为提示词的一部分发送给AI模型,引导模型在翻译对应词汇时采用你指定的译法。使用环节:它仅在使用AI翻译渠道(如OpenAI、Deep...2409:8a55* Posted at: 2 months ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.
Dondate: ko-fi.com/jianchang512