#694 InvalidParameter:<400> InternalError.Algo.InvalidParameter: The audio is empty

*123.42* Posted at: 7 hours ago 👁6

InvalidParameter: InternalError.Algo.InvalidParameter: The audio is empty

=====

Windows-10-10.0.26100-SP0

version:v3.80

frozen:True

language:zh

1 Replies

本条内容由 DeepSeek 回复
这个问题是由于您选择的语音识别服务(很可能是“阿里FunASR中文识别”)在处理音频时,检测到传入的音频数据为空或无效,从而返回了 InvalidParameter 错误。

核心原因分析:

pyVideoTrans 的核心工作是识别视频中的人声。这个错误表明,软件成功从您的视频文件中提取出了音频,但在将该音频发送给语音识别服务进行分析时,服务端认为收到的音频数据是“空的”。这通常由以下几种情况导致:

1. 视频文件问题:视频文件本身可能损坏,或者其音频轨道存在特殊编码问题,导致软件无法正确提取出人声部分。

2. 人声分离失败:软件在提取音频后,会尝试分离人声和背景音乐。如果分离过程失败,可能会导致传给识别服务的“人声”片段为空。

3. 网络或服务不稳定:您使用的语音识别服务(如阿里云FunASR)在接收数据时可能出现临时性问题。

解决方案(请按顺序尝试):

1. 更换语音识别渠道(最推荐)

  • 在软件主界面的“语音识别”下拉菜单中,暂时不要使用“阿里FunASR中文识别”。
  • 强烈推荐切换到 faster-whisper本地模式。这是一个本地运行的模型,不依赖网络,稳定性极高。虽然首次使用需要下载模型(可能会遇到网络问题,请参考知识库中的“模型下载失败”解决方案),但一旦下载成功,后续使用将非常可靠。

2. 检查并更换视频源文件

  • 尝试使用另一个不同的、确保包含清晰人声的视频文件进行测试,以排除是原始视频文件本身的问题。

3. 检查音频提取设置

  • 在软件的“高级选项”或“设置”中,检查与人声分离/音频提取相关的参数。如果您不熟悉这些高级设置,建议保持默认值。

4. 查看详细日志

  • 如果以上方法均无效,为了获得更精确的错误信息,请进入软件根目录下的 logs 文件夹,打开以今天日期命名的 .log 文件,将文件末尾的最后30-50行日志内容复制下来。提供这些信息将有助于进行更深入的诊断。

总结: 首选方案是更换为 faster-whisper本地模式 进行语音识别,这能有效规避因第三方API服务不稳定或音频格式兼容性问题导致的错误。

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Donate: https://ko-fi.com/jianchang512

Trending Questions