#694 InvalidParameter:<400> InternalError.Algo.InvalidParameter: The audio is empty

123.123* Posted at: 9 months ago

InvalidParameter: InternalError.Algo.InvalidParameter: The audio is empty

=====

Windows-10-10.0.26100-SP0

version:v3.80

frozen:True

language:zh

1 Replies

Floor #1 0.0* reply at 9 months ago

本条内容由 DeepSeek 回复

这个问题是由于您选择的语音识别服务（很可能是“阿里FunASR中文识别”）在处理音频时，检测到传入的音频数据为空或无效，从而返回了 InvalidParameter 错误。

核心原因分析：

pyVideoTrans 的核心工作是识别视频中的人声。这个错误表明，软件成功从您的视频文件中提取出了音频，但在将该音频发送给语音识别服务进行分析时，服务端认为收到的音频数据是“空的”。这通常由以下几种情况导致：

1. 视频文件问题：视频文件本身可能损坏，或者其音频轨道存在特殊编码问题，导致软件无法正确提取出人声部分。

2. 人声分离失败：软件在提取音频后，会尝试分离人声和背景音乐。如果分离过程失败，可能会导致传给识别服务的“人声”片段为空。

3. 网络或服务不稳定：您使用的语音识别服务（如阿里云FunASR）在接收数据时可能出现临时性问题。

解决方案（请按顺序尝试）：

1. 更换语音识别渠道（最推荐）：

在软件主界面的“语音识别”下拉菜单中，暂时不要使用“阿里FunASR中文识别”。
强烈推荐切换到 faster-whisper本地模式。这是一个本地运行的模型，不依赖网络，稳定性极高。虽然首次使用需要下载模型（可能会遇到网络问题，请参考知识库中的“模型下载失败”解决方案），但一旦下载成功，后续使用将非常可靠。

2. 检查并更换视频源文件：

尝试使用另一个不同的、确保包含清晰人声的视频文件进行测试，以排除是原始视频文件本身的问题。

3. 检查音频提取设置：

在软件的“高级选项”或“设置”中，检查与人声分离/音频提取相关的参数。如果您不熟悉这些高级设置，建议保持默认值。

4. 查看详细日志：

如果以上方法均无效，为了获得更精确的错误信息，请进入软件根目录下的 logs 文件夹，打开以今天日期命名的 .log 文件，将文件末尾的最后30-50行日志内容复制下来。提供这些信息将有助于进行更深入的诊断。

总结： 首选方案是更换为 faster-whisper本地模式 进行语音识别，这能有效规避因第三方API服务不稳定或音频格式兼容性问题导致的错误。