-
#3029 使用GPT-SoVITS,配音克隆,配音后的音频文件,没有声音...
💬 1[Last reply:4 months ago] 这是由于 GPT-SoVITS 生成的音频文件格式或编码问题导致的。解决方案:检查音频文件:在输出目录(通常是 _video_out)中找到 GPT-SoVITS 生成的 .wav 文件。尝试用系统自带的播放器(如 Windows 的媒体播放器)直接打开,确认文件本身是否有声音。检查 API 连接:确保 GPT-SoVITS 的 WebUI 服务已正确启动,并且在 pyVideoTrans 的 T...240e:341* Posted at: 4 months ago -
#3028 版本为3.86,通过教程安装CUDA加速,配置严格按照要求设置好,下载的内容也是在教程里的链接下载且严格按照版本号填写环境变量,重启电脑后依然无法正常启动加速,问题出在哪里?...
💬 8[Last reply:4 months ago] 这是由于视频编码/解码环节可能调用了 NVIDIA GPU 的硬件编码器(如 NVENC)和解码器(NVDEC),而非 CUDA 通用计算加速。您观察到的速度提升是真实的,但这通常不是由 pyVideoTrans 软件本身通过 CUDA 编程实现的,而是由 FFmpeg(视频处理核心工具)在运行时自动检测并调用您系统中 NVIDIA 显卡的专用媒体处理单元。这种调用需要满足以下条件:系统中安装了支...2408:8256* Posted at: 4 months ago -
#3027 RuntimeError: Unable to open file 'model.bin' in model 'E:/Downloadall/video tr/win-pyvideotrans-v3.96-131/models/models--Systran--faster-whisper-large-v3'...
💬 1[Last reply:4 months ago] 这是由于 faster-whisper 模型文件 model.bin 缺失或损坏导致的。软件尝试从 HuggingFace 下载模型失败,或模型文件不完整。解决方案:手动下载模型文件:访问 HuggingFace 模型页面:https://huggingface.co/Systran/faster-whisper-large-v3。点击 Files and versions 标签页。下载 mode...132.226* Posted at: 4 months ago -
#3026 pyimod03_ctypes.install.<locals>.PyInstallerImportError: Failed to load dynlib/dll 'D:\\BaiduNetdiskDownload\\_internal\\azure\\cognitiveservices\\speech\\Microsoft.CognitiveServic...
💬 2[Last reply:4 months ago] 一个可能的原因是,系统缺少vc++组件,尝试点击安装微软的这个vc++组件后,重启软件试试https://aka.ms/vs/17/release/vc_redist.x64.exe...240e:30c* Posted at: 4 months ago -
#3025 TaskCfg(cache_folder='E:/AI/win-pyvideotrans-v3.96-131/tmp/15716/e5afdf5fa9', target_dir='2026-01-30 16-40-56-mp4', remove_noise=False, is_separate=False, detect_language='ja', sub...
💬 1[Last reply:4 months ago] 这是由于输出目录路径包含空格,导致文件移动操作失败。问题原因:错误信息显示 FileNotFoundError: [WinError 3] 系统找不到指定的路径。,具体是尝试将文件移动到路径 '2026-01-30 16-40-56-mp4/2026-01-30 16-40-56.mp4' 时失败。该路径包含空格,在命令行或某些文件操作中可能引发问题。解决方案:立即解决:请检查...185.220* Posted at: 4 months ago -
#3024 把GPT-SoVITS接入pyVedioTrans后,选择训练好的音色,然后点试听配音没反应,导致合成的视频没声音,试听Edge-TTS中的角色,声音都正常。这是为什么?...
💬 7[Last reply:4 months ago] 这是因为你使用的 GPT-SoVITS API 脚本版本不支持通过命令行直接传递 --t2s_weights_path 和 --vits_weights_path 参数。你需要通过修改配置文件来指定模型路径。请按以下步骤操作:找到配置文件:在 GPT-SoVITS 项目根目录下,寻找名为 config.yml 或 config.yaml 或 tts_config.yaml 的文件。如果找不到,可以...240e:341* Posted at: 4 months ago -
#3015 不能试听配音的原因是什么?...
💬 6[Last reply:4 months ago] 不客气。如果后续在使用 pyVideoTrans 过程中遇到其他问题,可以随时提出。...123.132* Posted at: 4 months ago -
#3023 该角色不支持试听=system:Windows-10-10.0.26200-SP0version:v3.96frozen:Truelanguage:zhroot_dir:F:/ai/win-pyvideotrans-v3.96...
💬 1[Last reply:4 months ago] 该问题通常是因为在试听配音时,选择的TTS角色(音色)不被当前连接的TTS服务所支持。解决方案:检查TTS服务与角色匹配:确认你当前使用的配音渠道(如 F5-TTS、Qwen-TTS)是否支持你选择的角色。例如:在 Qwen-TTS(本地) 中,如果你选择了 clone 角色或使用了“参考音频”,则必须启动其语音克隆模型(Qwen3-TTS-12Hz-0.6B-Base 或 Qwen3-TTS-1...240e:341* Posted at: 4 months ago -
#3022 HTTPSConnectionPool(host='translate.google.com', port=443): Max retries exceeded with url: /m?sl=en&tl=zh-cn&hl=zh-cn&q=Most%20traders%20struggle,%20not%20because%20they%20lack%20s...
💬 1[Last reply:4 months ago] 这是由于网络代理配置错误或无法连接导致的。错误信息显示软件尝试通过代理访问 Google 翻译服务,但代理连接被目标计算机拒绝。解决方案:检查代理设置:在 pyVideoTrans 菜单栏中,点击“设置”->“网络代理”。如果你没有使用代理,请确保“使用网络代理”选项未勾选。如果你需要使用代理,请确保代理地址和端口正确且代理服务正在运行。更换翻译渠道:由于 Google 翻译在国内访问不稳定...183.253* Posted at: 4 months ago -
#3021 当前使用的是音色:clone,但Qwen-TTS端启动的模型不属于语音克隆模型,请检查启动Qwen-TTS的语音克隆模型Base,或者请选择内置音色进行配音...
💬 1[Last reply:4 months ago] 这是由于在 pyVideoTrans 中选择了 clone 音色进行配音,但本地启动的 Qwen-TTS 服务并非语音克隆模型(Base 模型)导致的。解决方案:检查并启动正确的 Qwen-TTS 模型:Qwen-TTS 本地模型分为三类:语音克隆模型 (Base)、自定义音色模型 (CustomVoice)、声音设计模型 (VoiceDesign)。clone 角色或使用“参考音频”进行配音,必...117.62* Posted at: 4 months ago -
#3020 文稿匹配可否遵循原文稿断句...
💬 3[Last reply:4 months ago] 您提供的截图显示,对齐结果将您的文稿分割成了非常细碎的片段(如“然后”、“我”、“们”),这正是“词级时间戳”导致的。要完全使用您的断句方案并避免词级分割,核心是绕过语音识别模型对文本的强制切分。请按以下步骤操作:准备文件:确保您的文稿是 .srt 格式。如果现在是.txt,请先转换为.srt。您可以使用任何字幕编辑器,或按以下格式手动创建:1 00:00:00,000 --> 00:00:...45.59* Posted at: 4 months ago -
#3019 TaskCfg(cache_folder='C:/ai/pyvideotrans-v3.96/tmp/2044/6f0a660868', target_dir='M:/亚AV/橘梨紗/_video_out/0207-star503-avi', remove_noise=False, is_separate=False, detect_language='ja...
💬 1[Last reply:4 months ago] 这是由于网络连接不稳定或Google语音识别API服务端中断导致的。切换语音识别渠道:Google识别API是免费服务,但连接不稳定。建议改用其他更稳定的渠道。推荐本地渠道:在“语音识别设置”中,选择 faster-whisper 或 openai-whisper,并确保已正确配置CUDA加速。推荐在线渠道:如果必须使用在线服务,可尝试配置 OpenAI语音识别API、阿里百炼Qwen3-ASR ...141.11* Posted at: 4 months ago -
#3018 TaskCfg(cache_folder='D:/project/Videotrans/win-pyvideotrans-v3.95-0128/tmp/19032/3be6a9c1a9', target_dir='C:/Users/savior/Desktop/_video_out/Udemy - 2026 Deep Agent - Multi Agent ...
💬 1[Last reply:4 months ago] 这是由于输出文件路径过长或包含特殊字符,导致文件移动失败。修改输出目录:在软件主界面,将“输出目录”修改为一个更短、不包含空格和特殊字符的路径,例如 D:\output。重命名源文件:将待处理的视频文件名缩短,避免使用过长的英文标题和空格。例如,将其重命名为 video.mp4 再进行处理。清理并重试:在软件菜单栏选择“工具”->“清理缓存”,然后重新开始翻译任务。请查阅相关文档:常见错误与...2408:8459* Posted at: 4 months ago -
#3016 aiohttp.client_exceptions.WSServerHandshakeError: 403, message='Invalid response status', url='wss://speech.platform.bing.com/consumer/speech/synthesize/readaloud/edge/v1?TrustedCl...
💬 2[Last reply:4 months ago] edgetts接口变了,这个音色已无法使用 升级最新版,使用尚可使用的音色...2408:8210* Posted at: 4 months ago -
#3017 TaskCfg(cache_folder=None, target_dir='d:/baidunetdiskdownload/output/translate', remove_noise=False, is_separate=False, detect_language=None, subtitle_language=None, source_langua...
💬 1[Last reply:4 months ago] 这是由于配置的 OpenAI 模型名称 gpt-4-turbo 不正确或您没有访问权限导致的 404 错误。解决方案:检查并修正模型名称:在 pyVideoTrans 的“翻译设置”中,找到您配置的 OpenAI 或兼容接口(如 DeepSeek)渠道。确认正确的模型名:如果您使用的是 OpenAI 官方 API,请确保您有 gpt-4-turbo 模型的访问权限。如果没有,请更换为可用的模型,例...185.217* Posted at: 4 months ago -
#3014 pyimod03_ctypes.install.<locals>.PyInstallerImportError: Failed to load dynlib/dll 'E:\\win-pyvideotrans-v3.96\\_internal\\azure\\cognitiveservices\\speech\\Microsoft.CognitiveServ...
💬 1[Last reply:4 months ago] 这是由于软件包文件缺失导致的。错误信息显示无法加载 Azure TTS 所需的动态链接库文件 Microsoft.CognitiveServices.Speech.core.dll。解决方案:重新下载完整版软件包:你当前使用的可能是补丁包或不完整的版本。请前往官方下载页面,下载完整的 .7z 压缩包(完整版)。彻底清理并重新解压:关闭 pyVideoTrans 软件。将当前有问题的 E:\win-...2607:8700* Posted at: 4 months ago -
#3013 TaskCfg(cache_folder='/Users/mac/pyvideotrans/tmp/65591/de0f790c08', target_dir='/Users/mac/pyvideotrans/output/recogn', remove_noise=False, is_separate=False, detect_language='aut...
💬 1[Last reply:4 months ago] 这是由于在 macOS 上使用 openai-whisper(本地) 语音识别时,PyTorch 的 MPS (Metal Performance Shaders) 后端不支持模型加载所需的特定稀疏张量操作导致的。解决方案:切换语音识别渠道:这是最直接的解决方法。在软件设置中,将语音识别渠道从 openai-whisper(本地) 切换为 faster-whisper。faster-whisper...23.163* Posted at: 4 months ago -
#3012 TaskCfg(cache_folder='/Users/mac/pyvideotrans/tmp/65591/cb4cd1bbc8', target_dir='/Users/mac/pyvideotrans/output/recogn', remove_noise=False, is_separate=False, detect_language='aut...
💬 1[Last reply:4 months ago] 这是由于在 macOS 系统上使用 openai-whisper(本地) 模型时,PyTorch 的 MPS(Metal Performance Shaders)后端不支持该模型所需的某些稀疏张量操作导致的。解决方案:更换语音识别渠道:这是最直接的解决方法。在软件界面的“语音识别渠道”中,将 openai-whisper(本地) 更换为 faster-whisper。faster-whisper ...23.177* Posted at: 4 months ago -
#3011 =====system:Windows-10-10.0.22631-SP0version:v3.96frozen:Truelanguage:zhroot_dir:D:/win-pyvideotrans-v3.96...
💬 3[Last reply:4 months ago] 根据你的描述,在使用“音视频字幕合并”功能时遇到报错。此功能通常指将视频/音频与SRT字幕文件合并,或进行格式转换。核心原因:报错通常与FFmpeg处理、文件路径或格式不兼容有关。解决方案:检查文件路径:确保你选择的视频、音频、字幕文件的路径不包含中文、空格或特殊符号。这是最常见的问题。检查文件完整性:确认视频、音频、字幕文件本身没有损坏,且字幕文件(SRT格式)编码正确(建议使用UTF-8编码)...137.189* Posted at: 4 months ago -
#3010 在哪里发送完整字幕让软件根据选择的字幕配音...
💬 1[Last reply:4 months ago] 在视频翻译任务中,要“发送完整字幕”给AI进行翻译,而不是直接用于配音。该选项位于翻译渠道的设置中。具体操作步骤如下:在软件主界面,点击“翻译设置”按钮。在弹出的翻译渠道配置窗口中,找到“发送完整字幕”或类似的复选框(通常在翻译模型选择框附近)。勾选此选项。这样,AI模型在翻译时会将整个SRT文件(包含所有时间轴和文本)作为上下文处理,可以提高翻译的连贯性和准确性。完成翻译后,软件会使用翻译好的字...27.47* Posted at: 4 months ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.
Dondate: ko-fi.com/jianchang512