#1071 上传的视频有中文说话的声音,但是报错提示没有说话声音

140.238* Posted at: 23 days ago 👁103

image
上传的视频有中文说话的声音,但是报错提示没有说话声音

11 Replies

根据错误信息“检测不到说话声音”,这通常表示语音识别引擎未能从您的视频中提取出有效的语音内容。请按照以下步骤排查:

  1. 检查视频源:确认您的视频确实包含清晰的人声对话,而非纯背景音乐、环境噪音或无声片段。软件无法处理硬字幕或画面中的文字。
  2. 调整语音识别设置

    • 在软件主界面的 “语音识别渠道” 下拉菜单中,尝试切换不同的识别引擎。例如,从 faster-whisper 切换到 openai-whisper阿里FunASR(本地)
    • 如果您使用的是本地模型(如 faster-whisper),请确保模型已成功下载。首次使用需要联网下载模型文件。
  3. 检查音频轨道:某些视频文件可能包含多条音轨,或者主要音轨并非人声。请尝试使用其他工具(如 FFmpeg)检查或提取视频中的音频,确认人声是否存在。
  4. 提供日志文件:如果以上步骤无法解决问题,请提供位于软件根目录下 logs/ 文件夹中的最新日志文件(例如 20250218.log),这将有助于进行更深入的分析。
  1. 取消选中“保留背景声”
  2. 如果还是如此,可能环境没有配置cuDNN,导致cuda加速失败,取消 CUDA加速
  3. 尝试按照此教程重新配置cuda https://pyvideotrans.com/gpu

谢谢

image
这个12.1的版本能配置CUDA吗

image
什么都没有添加,怎么还是不行

cuda也安装好了,12.1版本的也不能用

最后的报错信息和cuda无关,是edge-tts配音失败,如果没有使用代理,那么应该是被限流了,可以等待一段时间再试,或者使用其他配音渠道,如果使用了代理,就关闭代理。

软件绑定的是 cuda12.8,并且需要安装cudnn才可启用cuda加速,12.1未测试,详细安装查看 https://pyvideotrans.com/gpu

如果视频中没有人说话的声音,那个功能能翻译视频中的文字和字幕

根据开发者回复和您提供的信息,问题已经明确:

  1. 当前主要问题是 Edge-TTS 配音失败:这是由微软服务器限流或网络连接问题导致的,与 CUDA 无关。

    • 解决方案

      • 临时方案:在软件菜单栏选择 工具/选项 -> 高级选项。在“配音调整”区域,将“同时配音字幕数”改为 1,并将“配音后暂停时间/秒”设为 5 或更高,以降低请求频率。
      • 根本方案:切换到其他配音渠道,例如 OpenAI TTSAzure TTS(需要配置API密钥)。
  2. 关于 CUDA 加速

    • 软件预打包版绑定的 CUDA 版本是 12.8。您安装的 CUDA 12.1 版本未经测试,可能不兼容。
    • 要启用 CUDA 加速,必须同时安装对应版本的 cuDNN。请严格按照教程 https://pyvideotrans.com/gpu 进行配置。如果配置失败或觉得复杂,请直接取消勾选主界面的“CUDA加速”选项,软件将使用CPU运行,功能不受影响。
  3. 关于翻译视频中的文字/硬字幕
    不能。 pyVideoTrans 的核心功能是基于语音识别(ASR) 来工作的。它只能识别视频中的人声对话,并生成字幕,然后进行翻译和配音。它无法识别和提取已经嵌入在视频画面中的文字(即“硬字幕”)。处理硬字幕需要使用专门的 OCR (光学字符识别) 工具,这超出了本软件的功能范围。

image
为什么音频翻译成功了,但是字幕没有翻译成相应的语言文字字幕

您遇到的问题是因为软件成功识别了原始语音并生成了源语言字幕,但在“翻译”步骤中,您选择的翻译渠道未能正常工作,导致字幕没有被翻译成目标语言。

请按以下步骤检查和解决:

  1. 检查翻译设置:在软件主界面,确认您已正确选择了“目标语言”(例如“中文(简体)”)。然后点击菜单栏的 翻译设置,检查您选择的“翻译渠道”是否有效。

    • 如果使用的是 GoogleMicrosoft 等免费在线翻译,请确保您的网络连接正常,没有防火墙或代理阻挡。
    • 如果使用的是 OpenAIGeminiDeepSeek 等AI模型,请确保您已正确填写了API密钥,并且账户有足够的余额或配额。
  2. 查看日志文件:翻译失败的具体原因会记录在日志中。请打开软件根目录下的 logs/ 文件夹,查看最新的日志文件(如 20250218.log),搜索“翻译”或“translate”相关的错误信息,这将提供最直接的线索。
  3. 临时解决方案:如果暂时无法解决翻译渠道的问题,您可以利用软件的其他功能来完成翻译:

    • 首先,使用 “音视频转字幕” 功能,它会输出源语言的字幕文件(如 原视频名_源语言.srt)。
    • 然后,使用 “批量翻译SRT字幕” 功能,导入上一步生成的SRT文件,并选择其他可用的翻译渠道进行翻译。

根据您截图中的界面,问题极大概率出在翻译渠道的配置或连接上。请优先检查第1步。

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Donate: https://ko-fi.com/jianchang512

Trending Questions