-
#3568 AttributeError: 'FormatcoverForm' object has no attribute 'videourls'...
💬 2[Last reply:2 months ago] bug 等后续修复...205.198* Posted at: 2 months ago -
#3567 配音失败,请检查网络或代理设置:403, message="Invalid response status", url="wss://speech.platform.bing.com/consumer/speech/synthesize/r......
💬 1[Last reply:2 months ago] 这是由于 Edge-TTS 渠道并发请求过高,触发了微软服务器的限流保护机制。解决方案:在软件主界面,点击顶部菜单栏的“工具”->“高级选项”。在弹出的窗口中,找到“【字幕配音调整】”区域。将“EdgeTTS配音渠道配音并发数”设置为 1。将“配音后暂停秒”设置为 5 或更高(例如 10)。保存设置并重新尝试配音任务。预防措施:避免短时间内对大量视频或长视频使用 Edge-TTS 进行配音。...122.96* Posted at: 2 months ago -
#3565 TaskCfgVTT(is_cuda=False, uuid='f694ba718f', cache_folder='C:/Users/haigui888/Desktop/xiazai/转换工具/win-pyvideotrans/tmp/6300/f694ba718f', target_dir='C:/Users/haigui888/Desktop/xiaz...
💬 1[Last reply:2 months ago] 这是由于 Google 语音识别 API 的网络连接不稳定或被阻断导致的。Google 服务在中国大陆地区需要配置网络代理才能正常访问。解决方案:配置网络代理:在软件主界面的“网络代理”输入框中,填写你的代理地址和端口,格式为 http://127.0.0.1:端口号 或 socks5://127.0.0.1:端口号。切换语音识别渠道:如果无法配置代理,建议改用无需代理的本地或国内在线识别渠道。本...103.85* Posted at: 2 months ago -
#3564 TaskCfgVTT(is_cuda=True, uuid='4eec5068f4', cache_folder='D:/project/Videotrans/win-pyvideotrans-v3.97-0304/tmp/14092/4eec5068f4', target_dir='C:/Users/savior/Desktop/1/_video_out/...
💬 1[Last reply:2 months ago] 语音识别阶段出现 AssertionError: non-negative timestamp expected 错误,通常是由于音频预处理(如降噪)或语音活动检测(VAD)参数设置不当,导致生成的音频片段时间戳出现负值。解决方案:检查降噪设置:从日志中看到 remove_noise=True。请尝试在软件主界面取消勾选 降噪 选项,然后重新运行任务。调整语音识别参数:如果取消降噪后问题依旧,请调...113.108* Posted at: 2 months ago -
#3563 RuntimeError: File model.bin is incomplete: failed to read a buffer of size 132774400 at position 187...
💬 1[Last reply:2 months ago] 这是由于 faster-whisper 模型文件下载不完整或损坏导致的。解决方案:删除损坏的模型文件:前往软件安装目录 D:/videotrans 下的 models 文件夹,找到并删除 models--Systran--faster-whisper-large-v3 文件夹(或您正在使用的其他模型文件夹)。重新下载模型:方法一(自动):确保网络连接正常,重新运行软件并选择 faster-whis...91.199* Posted at: 2 months ago -
#3562 外语翻中文,看剧用,怎么设置最好...
💬 1[Last reply:2 months ago] 对于外语视频翻译成中文用于看剧,最佳设置应优先考虑翻译准确性和配音自然度。以下是基于知识库推荐的分步配置方案:1. 语音识别(提取原文字幕)渠道:根据原视频语言选择:英语:faster-whisper(本地),模型选择 large-v3。日语:Huggingface_ASR,模型选择 reazon-research/japanese-wav2vec2-large-rs35kh。其他小语种:考虑使用...240e:30e* Posted at: 2 months ago -
#3561 TaskCfgVTT(is_cuda=True, uuid='26a05be39b', cache_folder='D:/project/Videotrans/win-pyvideotrans-v3.97-0304/tmp/13428/26a05be39b', target_dir='C:/Users/savior/Desktop/_video_out/p1...
💬 1[Last reply:2 months ago] 这是由于显存或内存不足导致 faster-whisper 语音识别进程崩溃。根据日志,您使用了 faster-whisper(本地) 的 large-v3-turbo 模型,并开启了 CUDA 加速 (is_cuda=True)。错误信息 A child process terminated abruptly 和 可能内存或显存不足 表明 GPU 显存或系统内存不足以处理该任务。解决方案:降低模型...212.87* Posted at: 2 months ago -
#3560 OSError: cannot load library '/Users/ysihaiditing/pyvideotrans/.venv/lib/python3.10/site-packages/_soundfile_data/libsndfile.dylib': dlopen(/Users/ysihaiditing/pyvideotrans/.venv/l...
💬 23[Last reply:2 months ago] 理论上,选择 medium 模型(非 .en 版本)是可以识别阿拉伯语的,因为它是多语言模型。但是,如果识别结果仍然是英语,主要原因可能有两个:1. 发音语言设置错误:这是最常见的原因。您必须在“发音语言”下拉菜单中明确选择“阿拉伯语”或“ar”。如果选择了“auto”(自动检测),模型可能错误地将阿拉伯语语音判断为英语。根据知识库第6.9节说明,在“翻译视频或音频”功能中,“自动检测”选项已被...60.248* Posted at: 2 months ago -
#3559 cli命令行模式只能单角色配音吗...
💬 1[Last reply:2 months ago] CLI命令行模式默认支持单角色配音。如需多角色配音,需要手动编辑配置文件或使用GUI界面预先设置。根据知识库,CLI命令行模式主要用于无头批处理,其核心配置通过命令行参数传递。在 TaskCfgTTS 配置类中,voice_role 字段用于指定配音角色,默认情况下该字段为单一角色。实现多角色配音的步骤:使用GUI界面预先处理:在GUI界面的“翻译视频或音频”功能中,可以配置多角色配音(如为不同说...154.3* Posted at: 2 months ago -
#3558 RuntimeError: File model.bin is incomplete: failed to read a buffer of size 3276800 at position 508807659...
💬 1[Last reply:2 months ago] 这是由于 faster-whisper 模型文件下载不完整或损坏导致的。解决方案:手动下载并替换模型文件:根据你使用的模型(例如 large-v3),在软件根目录下的 models 文件夹内,找到对应的模型文件夹(例如 models--Systran--faster-whisper-large-v3)。从 HuggingFace 官方页面(例如 https://huggingface.co/Sys...142.249* Posted at: 2 months ago -
#3557 d:\pyvideotrans>uv run cli.py --task vtv \ --name "D:\cs.mp4" \ --source_language_code "en" \ --target_language_co......
💬 1[Last reply:2 months ago] 命令行参数 --enable_diariz True 和 --nums_diariz -1 的格式不正确,导致命令执行失败。解决方案:布尔值参数 --enable_diariz 后面直接跟 True 或 False,中间不应有空格。应修改为 --enable_diariz True。整数参数 --nums_diariz 的值 -1 是有效的,表示自动检测说话人数。修正后的命令应为:uv run c...154.3* Posted at: 2 months ago -
#3555 字幕翻译结束等待下一步配音阶段Traceback (most recent call last): File "d:\pyvideotrans\videotrans\tts\_base.py", line 127, in runloop ......
💬 1[Last reply:2 months ago] 这是由于 Edge-TTS 配音渠道的 voice 参数类型错误导致的。核心错误是 TypeError: voice must be str,表明传递给 Edge-TTS 的配音角色参数不是字符串类型。解决方案:检查并重新选择配音角色:在软件主界面的“配音渠道”行,确保“配音角色”下拉框已正确选择了一个具体的发音人(例如 zh-CN-XiaoxiaoNeural),而不是空值或非字符串选项。检查目...154.3* Posted at: 2 months ago -
#3554 d:\pyvideotrans>uv run cli.py --task vtv --name "D:\cs.mp4" --source_language_code "en" --target_language_code "zh-cn......
💬 1[Last reply:2 months ago] 这是由于命令行参数格式错误导致的。--voice_autorate、--video_autorate 和 --recogn2pass 是布尔标志参数,不需要在其后附加 True 值。解决方案:移除 --voice_autorate、--video_autorate 和 --recogn2pass 参数后面的 True 值。正确的命令格式应为:uv run cli.py --task vtv --n...154.3* Posted at: 2 months ago -
#3553 [参数列表] {'name': 'D:/cs.mp4', 'cache_folder': 'd:/pyvideotrans/tmp/42176/ceec650470', 'target_dir': 'd:/pyvideotrans/outp......
💬 1[Last reply:2 months ago] 该配置存在多个影响翻译质量和效率的问题,核心原因是使用了性能较差的默认模型和未启用关键优化选项。主要问题与解决方案:语音识别模型过小:model_name 为 tiny,识别准确度很低,不推荐使用。解决:将 model_name 改为 large-v3(最佳)或 large-v2、large-v3-turbo。如果显存/内存不足,可降级为 small 或 medium。未启用 CUDA 加速:is...154.3* Posted at: 2 months ago -
#3552 我要用到配音渠道、说话人识别、模型等参数,完整命令。用微软的识别以及翻译...
💬 1[Last reply:2 months ago] 根据你的需求,你需要使用命令行模式(CLI)来执行一个完整的视频翻译任务,并指定使用微软的语音识别和翻译渠道。以下是基于知识库中 TaskCfgVTT 配置类和 CLI 使用说明构建的完整命令示例。核心命令结构:uv run cli.py --task vtv --name "你的视频文件路径" --source_language_code zh --target_langua...154.3* Posted at: 2 months ago -
#3551 TaskCfgTTS(is_cuda=False, uuid='30af9ccb4f', cache_folder='E:/Download_File/Folder/movietools/pyvideotrans/tmp/4508/30af9ccb4f', target_dir='E:/Download_File/Folder/asmr/zimu/观念反转!...
💬 1[Last reply:2 months ago] 错误原因是配音对齐计算时,某条字幕的原始音频时长为0,导致计算加速倍数时出现除零错误。解决方案:检查字幕文件:打开 E:/Download_File/Folder/asmr/zimu/观念反转!淫荡女主播直播后遭男友饥渴线下诱骗/观念反转!淫荡女主播直播后遭男友饥渴线下诱骗_000.srt 文件,检查是否存在时间轴异常(例如开始时间等于结束时间,或时长极短)的字幕行。调整对齐设置:在软件主界面或“...203.10* Posted at: 2 months ago -
#3550 HTTPSConnectionPool(host='openspeech.bytedance.com', port=443): Max retries exceeded with url: /api/v1/vc/submit?appid=1070910001&language=en-US&use_itn=True&caption_type=speech&ma...
💬 1[Last reply:2 months ago] 该错误是由于与字节火山语音识别API的SSL连接失败导致的,通常与网络环境或软件版本有关。解决方案:升级软件版本:你当前使用的是 v3.91 版本。请先升级到最新版 v3.97,许多网络和API连接问题在新版本中已得到优化。检查网络连接:确保你的网络可以正常访问 openspeech.bytedance.com(字节火山服务)。如果在中国大陆,可能需要配置网络代理。配置网络代理:在软件主界面的“网...213.130* Posted at: 2 months ago -
#3549 我要用到配音渠道、说话人识别、模型等参数,完整命令...
💬 1[Last reply:2 months ago] 您需要的是使用 pyVideoTrans 命令行模式(CLI)进行视频翻译的完整命令示例,该命令应包含配音渠道、说话人识别、模型选择等参数的配置。根据知识库,命令行模式通过 cli.py 调用,核心任务类型为 vtv(视频翻译)。以下是包含您所需参数的完整命令示例:uv run cli.py --task vtv --name "your_video.mp4" --source...154.3* Posted at: 2 months ago -
#3548 uv run cli.py --task vtv --name "视频路径" --source_language_code "源语言" --target_language_code "目标语言" [可选参数],用这个命令为什么不能直接翻译出......
💬 1[Last reply:2 months ago] 这是因为命令行模式默认配置可能未指定配音渠道和角色,导致只生成翻译后的字幕而没有配音。要使用命令行模式生成带中文配音的视频,需要额外指定配音相关的参数。以下是解决方案:检查必要参数:确保至少指定了以下核心参数:--tts_type:指定配音渠道(例如,使用 Edge-TTS 免费渠道可设为 1)。--voice_role:指定配音角色(例如,中文女声可设为 zh-CN-XiaoxiaoNeural...154.3* Posted at: 2 months ago -
#3547 [2026-03-10 18:51:41,716] ERROR in start: [api]error: 400 Bad Request: The browser (or proxy) sent a request that this s......
💬 1[Last reply:2 months ago] 这是由于向外部 TTS 服务(如 F5-TTS、GPT-SoVITS 等)发送的 API 请求格式不正确或服务端无法理解导致的。检查 API 服务状态:确保你使用的 TTS 服务(如 F5-TTS、GPT-SoVITS、CosyVoice 等)已正确启动,并且其 API 服务正在运行(例如 http://127.0.0.1:7860 或 http://localhost:8000)。核对 API ...103.151* Posted at: 2 months ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.