-
#4051 ValueError: Unsupported languages: ['Hindi']. Supported: ['auto', 'chinese', 'english', 'french', 'german', 'italian', 'japanese', 'korean', 'portuguese', 'russian', 'spanish']...
💬 1[Last reply:1 month ago] The error occurs because the Qwen-TTS (local) voice synthesis channel does not support the target language "Hindi" you selected. The channel only supports a limited set of languages: auto, chinese, en...103.16* Posted at: 1 month ago -
#4049 OmniVoice-TTS 配置面板中,找到“instruct”输入框...
💬 1[Last reply:1 month ago] 在 OmniVoice-TTS 的配置面板中,“instruct”输入框位于“角色”选择框的右侧。具体查找路径如下:点击软件主界面右上角的 菜单 -> 翻译设置。在弹出的设置窗口中,找到并点击 OmniVoice-TTS 标签页。在该标签页中,找到 “角色” 下拉选择框。“instruct”输入框就紧邻在“角色”选择框的右侧,用于输入自定义指令以微调音色。请查阅相关文档:OmniVoice-...182.105* Posted at: 1 month ago -
#4048 语音识别阶段出错 [Qwen-ASR(本地)] Try: pip install transformers -U or pip install -e '.[dev]' if you're working with git......
💬 1[Last reply:1 month ago] 这是由于 Qwen-ASR(本地) 渠道依赖的 tokenizers 库版本不兼容导致的。软件内置的 tokenizers 版本为 0.19.1,但 Qwen-ASR 需要版本在 0.22.0 到 0.23.0 之间。解决方案:临时方案(推荐):更换语音识别渠道。对于中文视频,可以尝试使用 faster-whisper(本地) 的 large-v3 模型,或 openai-whisper(本地) ...116.28* Posted at: 1 month ago -
#4047 TaskCfgTTS(is_cuda=False, uuid='2d863cd941', cache_folder='C:/peiyinruanjian/2/win-pyvideotrans-v3.98-0410/tmp/20928/2d863cd941', target_dir='C:/peiyinruanjian/2/win-pyvideotrans-v...
💬 1[Last reply:1 month ago] 这是由于你使用了 ElevenLabs 配音渠道的付费角色,但你的 ElevenLabs 账户是免费订阅,无法通过 API 使用其官方音库中的角色。解决方案:更换配音渠道或角色:在配音渠道中选择其他免费渠道(如 Edge-TTS)或 ElevenLabs 中明确标记为免费的克隆角色。升级 ElevenLabs 订阅:前往 ElevenLabs 官网升级你的账户为付费订阅,以解锁官方音库的 API ...148.135* Posted at: 1 month ago -
#4046 TaskCfg(cache_folder='D:/tts/tmp/7996/20059c023f', target_dir='E:/音频库/4.13/_video_out/1 (1)-mp4', remove_noise=False, is_separate=False, detect_language='en', subtitle_language=Non...
💬 1[Last reply:1 month ago] 这是由于网络代理设置不正确或代理服务不可用导致的。faster-whisper 在尝试从 HuggingFace 下载模型时,因代理问题而失败。解决方案:检查并修正代理设置:在主界面的“网络代理地址”文本框中,确认您填写的代理地址格式正确(例如 http://127.0.0.1:10808)。如果代理服务未运行或端口错误,请修正。关闭代理:如果您没有可用的代理服务,或不确定如何设置,请直接清空“网...1.161* Posted at: 1 month ago -
#4045 FileNotFoundError: [Errno 2] No such file or directory: 'ffmpeg'...
💬 1[Last reply:1 month ago] 这是由于 macOS 系统上缺少 FFmpeg 环境导致的。pyVideoTrans 依赖 FFmpeg 来处理音视频文件,而预打包的 macOS 版本可能不包含 FFmpeg。解决方案:打开终端(Terminal)。使用 Homebrew 安装 FFmpeg:brew install ffmpeg。安装完成后,重启 pyVideoTrans 软件。如果安装 Homebrew 后问题依旧,请确保 ...125.46* Posted at: 1 month ago -
#4044 videotrans.util.help_ffmpeg._FFprobeInternalError: [mov,mp4,m4a,3gp,3g2,mj2 @ 0000017d3c84d380] moov atom not found D:/BaiduNetdiskDownload/win-pyvideotrans-v3.98-0403/tmp/6244/051...
💬 3[Last reply:1 month ago] 错误核心原因是软件在音画对齐阶段,尝试读取临时生成的无声视频文件(novoice.mp4)时,发现该文件不完整或已损坏(moov atom not found),导致无法获取视频时长,进程中断。解决方案:强制重新处理:在主界面左上角勾选 清理已生成 复选框,然后重新执行翻译任务。这将清除所有缓存文件,强制软件重新生成所有中间文件。优化文件路径:确保你的原始视频文件路径(从盘符到文件名)不包含中文、...45.78* Posted at: 1 month ago -
#1320 ValueError: Requested float16 compute type, but the target device or backend do not support efficient float16 computation....
💬 11[Last reply:1 month ago] 问题核心是使用 large-v3 模型进行语音识别时,由于模型过大或系统资源不足,导致子进程异常终止。日志显示 is_cuda=False,说明已关闭CUDA加速,但CPU处理 large-v3 模型仍可能导致内存不足。请按以下步骤解决:更换更小的语音识别模型:在主界面的“语音识别”渠道中,将模型从 large-v3 更换为 medium 或 small。这是最直接有效的解决方案。调整高级选项中的...2401:c080* Posted at: 6 months ago -
#4043 卡在 STT use large-v3 starting......
💬 11[Last reply:1 month ago] 问题核心是 large-v3 模型在 CUDA 环境下初始化失败,导致进程卡死。虽然视频缩短,但模型加载阶段即出现问题。解决方案:验证 CUDA 环境:在 CMD 中运行 nvcc -V 和 nvidia-smi,确认 CUDA 版本为 12.8,且 4080 显卡驱动为最新。强制使用 CPU 模式测试:在主界面取消勾选“CUDA加速”,然后重新运行。如果 CPU 模式下能顺利通过“STT sta...1.160* Posted at: 1 month ago -
#4042 双语字幕如何调整字幕样式,比如我希望中文字幕字体大些,英文小些...
💬 5[Last reply:1 month ago] 在 v3.98 版本中,硬字幕样式编辑器确实只有一组样式设置,无法直接为双语字幕的两行分别设置不同样式。这是一个已知的功能限制。要实现中文字体大、英文字体小的效果,目前需要通过间接方法实现:生成双语字幕文件:使用软件正常完成视频翻译,并选择输出“双字幕”(例如“嵌入软字幕(双)”)。翻译完成后,在输出文件夹中找到生成的双语 .srt 字幕文件。使用外部字幕编辑软件调整样式:使用专业的字幕编辑软件(...2409:8a55* Posted at: 1 month ago -
#4041 requests.exceptions.ConnectionError: HTTPConnectionPool(host='127.0.0.1', port=9988): Max retries exceeded with url: /apitts (Caused by NewConnectionError('<urllib3.connection.HTTP...
💬 1[Last reply:1 month ago] 这是由于你使用了需要本地部署的配音渠道(例如 F5-TTS、CosyVoice、GPT-SoVITS、ChatterBox 等),但对应的本地服务没有启动或端口配置错误。解决方案:确认你使用的配音渠道:查看主界面“配音渠道”下拉列表中的选择。如果是 F5-TTS、CosyVoice、GPT-SoVITS、ChatterBox、Index-TTS 等,都需要先独立部署并启动其 API 服务。启动外部...5.34* Posted at: 1 month ago -
#4039 如何添加双语硬字幕,包括样式的调整,如中文字大小,英文字大小等...
💬 15[Last reply:1 month ago] 要使用 ass.json 文件设置双字幕样式,需要分别创建并配置原始语言和目标语言的字幕样式。操作步骤:定位配置文件:软件根目录下应存在 ass.json 文件。如果没有,可以在完成一次视频翻译并嵌入双字幕(硬或软)后,在输出文件夹或临时文件夹中找到生成的 ass.json 文件作为模板。理解结构:一个典型的双字幕 ass.json 文件应包含两个独立的样式块(Style),分别对应原始语言和目标...2409:8a55* Posted at: 1 month ago -
#4040 openai.InternalServerError: Error code: 503 - {'error': {'code': 'model_not_found', 'message': 'No available channel for model gpt-5.2-pro under group openai_azure (distributor) (r...
💬 1[Last reply:1 month ago] 这是由于在 Azure OpenAI 服务中请求了不存在的模型名称 gpt-5.2-pro 导致的。检查并修正模型名称:在软件菜单栏中,点击 翻译设置 -> OpenAI ChatGPT,检查 模型 输入框中的内容。Azure OpenAI 的模型名称通常为 gpt-4o、gpt-4-turbo 或 gpt-35-turbo 等,而不是 gpt-5.2-pro。确认模型部署:确保您在 Azu...2408:8207* Posted at: 1 month ago -
#4038 翻译术语表的原理是什么...
💬 1[Last reply:1 month ago] 翻译术语表用于在AI翻译环节,向翻译模型(如ChatGPT、DeepSeek等)提供特定的术语对照关系,强制AI在翻译时优先使用你指定的译法,以确保专业术语、品牌名、人名等翻译的一致性。原理:在调用AI翻译接口时,软件会将你填写的术语表内容(格式为源术语=目标术语)作为提示词的一部分发送给AI模型,引导模型在翻译对应词汇时采用你指定的译法。使用环节:它仅在使用AI翻译渠道(如OpenAI、Deep...2409:8a55* Posted at: 1 month ago -
#4037 requests.exceptions.ProxyError: HTTPSConnectionPool(host='translate.google.com', port=443): Max retries exceeded with url: /m?sl=ko&tl=zh-cn&hl=zh-cn&q=%EC%98%A4%EB%8A%98%EC%9D%80%...
💬 1[Last reply:1 month ago] 这是由于网络代理设置不正确或代理服务未运行导致的。错误信息显示软件尝试通过代理连接 Google 翻译服务,但代理服务器拒绝了连接。解决方案:检查并确保您的代理客户端(如 VPN 或代理软件)正在运行。在主界面的“网络代理地址”文本框中,确认填写的代理地址和端口号正确。格式通常为 http://127.0.0.1:端口号(例如 http://127.0.0.1:10808)。如果您没有可用的代理服...49.77* Posted at: 1 month ago -
#4036 程序内部错误:Parameter randomize_seed is not a valid key-word argument. Please click on 'view API' in the footer of the Gradio......
💬 1[Last reply:1 month ago] 这是由于 F5-TTS API 服务的版本或参数不兼容导致的。解决方案:确保你部署的 F5-TTS 服务是最新版本,并且其 API 接口支持 randomize_seed 参数。如果更新 F5-TTS 服务后问题依旧,请尝试在 pyVideoTrans 的“高级选项”中,将 F5-TTS 的 API 地址从 http://127.0.0.1:7860/ 修改为 http://127.0.0.1:7...91.243* Posted at: 1 month ago -
#4035 pyvideotrans...
💬 1[Last reply:1 month ago] 这是由于本地大模型(如 Ollama 中的 Qwen2.5)在翻译阶段主要依赖 CPU 进行推理,而 CUDA 加速仅对语音识别(ASR)阶段有效。解决方案:确认工作阶段:软件工作流程为 语音识别 -> 字幕翻译 -> 语音合成 -> 视频合成。CUDA 加速仅作用于第一步“语音识别”(例如使用 faster-whisper 等本地模型时)。当进入“字幕翻译”阶段,使用本地 Ol...111.18* Posted at: 1 month ago -
#4034 处理数据时缺少必需的键:'emo_control_method': Traceback (most recent call last): File "videotrans\tts\_f5tts.py", line 188, in _item_task_index File "gradio_client\client.py", line 497, in...
💬 1[Last reply:1 month ago] 这是由于您使用的 F5-TTS API 服务版本与 pyVideoTrans v3.98 内置的调用参数不兼容导致的。错误表明 API 不接受 emo_ref_path 参数,并导致后续缺少 emo_control_method 键。解决方案:确认 F5-TTS 服务版本:请检查您本地部署的 F5-TTS 项目版本。pyVideoTrans v3.98 设计用于兼容 F5-TTS v1 版本的 A...91.243* Posted at: 1 month ago -
#4033 上传了准确的字幕,但是使用index克隆配音,成品视频的配音不准确。...
💬 19[Last reply:1 month ago] 问题核心原因:目前没有完全免费、支持高质量法语、并且支持声音克隆的配音渠道。这是一个技术限制和资源限制的综合结果。详细分析:支持克隆:声音克隆功能通常需要复杂的模型和大量计算资源,免费提供的服务极少。支持法语:法语属于相对主流语言,但免费且高质量的TTS服务本身就不多。免费:完全免费、无限制使用的商业级克隆TTS服务几乎不存在。根据知识库,目前可用的方案按优先级排序如下:方案一:Edge-TTS(...91.243* Posted at: 1 month ago -
#4032 index tts是否支持法语配音、法语声音克隆?...
💬 3[Last reply:1 month ago] 是的,选择 clone 角色时,软件会自动将原视频中与当前字幕时间轴对应的语音片段(时长3-10秒)作为参考音频,用于声音克隆。你无需手动上传任何参考音频。重要注意事项:确保字幕时长合适:为了克隆成功,每条字幕对应的原始语音片段时长应在3-10秒之间。因此,在语音识别阶段需要进行以下设置(位于 菜单-工具-高级选项-语音识别参数):将 最短语音持续毫秒 设为 3000。将 最长语音持续秒数 设为 ...91.243* Posted at: 1 month ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.