#1007 videotrans.configure._except.StopRetry: InvalidParameter:<400> InternalError.Algo.InvalidParameter: The audio is empty

2409:8a28* Posted at: 9 months ago

语音识别阶段出错:[阿里百炼 Qwen3-ASR] InvalidParameter: InternalError.Algo.InvalidParameter: The audio is empty :
Traceback (most recent call last):
File "videotrans\task\job.py", line 112, in run
File "videotrans\task\_speech2text.py", line 91, in recogn
File "videotrans\recognition\__init__.py", line 198, in run
File "videotrans\recognition\_base.py", line 78, in run
File "tenacity\__init__.py", line 338, in wrapped_f
File "tenacity\__init__.py", line 477, in call
File "tenacity\__init__.py", line 378, in iter
File "tenacity\__init__.py", line 400, in
File "concurrent\futures\_base.py", line 439, in result
File "concurrent\futures\_base.py", line 391, in __get_result
File "tenacity\__init__.py", line 480, in call
File "videotrans\recognition\_qwen3asr.py", line 56, in _exec

videotrans.configure._except.StopRetry: InvalidParameter: InternalError.Algo.InvalidParameter: The audio is empty

Windows-10-10.0.26200-SP0
version:v3.81
frozen:True
language:zh

Floor #1 0.0* reply at 9 months ago

本条内容由 gpt-5-mini 回复

问题很可能是“语音文件为空或提取失败”，导致阿里百炼 Qwen3-ASR 返回 The audio is empty。请按下列步骤排查并修复：

验证源文件确实包含音频
- 用播放器直接播放原始视频/音频，确认有声音且时长合理（不是完全静音或极短片段）。
- 如果是纯背景音乐或没有人声，识别会失败（软件仅处理有人类语音的音视频）。
检查软件是否正确提取/准备了上传的音频（查看日志）
- 打开软件根目录下的 videotrans/logs/，定位最近的 {年月日}.log，查看识别前后的日志条目，确认有没有 “提取音频” 或 “ffmpeg/音频切片” 类的错误或空文件提示。
- 如果日志显示上传前音频长度为0或找不到音频，即为提取失败（需按步骤4处理）。
确认识别通道与模型状态
- 如果选择的是本地模型（如 faster-whisper/本地whisper等），确认本地模型已下载并可用（本地模型首次使用需下载）。
- 若使用在线阿里 Qwen3-ASR，检查当前识别通道是否正确配置（API Key/网络），并尝试切换到另一个识别通道以排除通道专有问题（例如切换到本地的 faster-whisper 测试能否成功）。
常见导致“音频为空”的具体原因与对应处理
- 源文件路径或文件名中包含特殊字符/中文/空格：将媒体文件放到一个短且纯英文路径（或无空格路径）下重试。
- 音频提取工具失败（可能是提取步骤被阻断）：重启软件并重试任务，或用其他工具手动将视频导出为 wav 再用“音视频转字幕”功能测试识别。
- 文件为极短或静音片段：用播放器检查音量波形，必要时重新生成/转码音频。
复现与并行/并发相关检查
- 若同时进行多个识别任务或软件设置了较高并发，尝试只识别单个文件（或在“高级选项”中将并发数降到 1）后重试，看是否仍出现空音频错误。
若上述检查无效，请提供信息以便进一步分析
- 把 videotrans/logs/ 目录下的最新一份日志文件粘贴或上传（尤其是包含该任务时间段的日志行）。
- 附上出错时使用的识别通道名称（例：阿里百炼 Qwen3-ASR）、源文件名及其时长、软件版本（你已给出 v3.81，已记录）。

如果有日志我可以根据具体报错行给出更精确的修复步骤。

Floor #2 2a0c:2500* reply at 9 months ago

没用，sensevoice和fastwhisper都是可以的

Floor #3 0.0* reply at 9 months ago

本条内容由 gpt-5-mini 回复

您提到 SenseVoice 和 faster-whisper 这两个本地语音识别渠道可以正常使用，这表明视频的音频提取没有问题，且本地模型的运行环境是正常的。

这意味着问题出在 阿里百炼 Qwen3-ASR 服务的特定配置或与该服务交互的环节上。虽然错误提示是 The audio is empty，但这在其他识别渠道正常的情况下，通常是 阿里百炼 Qwen3-ASR 端在处理请求时，未能正确接收或解析音频数据，或者API密钥/认证问题导致服务拒绝，并返回了一个误导性的“音频为空”错误。

请尝试以下排查步骤：

检查阿里百炼 Qwen3-ASR 的 API 密钥和区域设置：
- 在软件菜单栏选择 语音识别设置。
- 确保您为 阿里百炼 Qwen3-ASR 渠道填写的 AccessKey ID 和 AccessKey Secret 是正确且有效的。
- 同时，确认选择的 Region (区域) 与您的密钥和账户服务区域一致。不正确的密钥或区域可能导致 API 请求失败。
检查网络连接（针对阿里百炼 API）：
- 虽然您可以访问 HuggingFace (如果是下载模型，且已解决)，但 阿里百炼 Qwen3-ASR 的 API 地址可能不同。请确保您的网络环境可以正常访问阿里云的相关 API 服务端点。
- 如果您使用了代理，请检查代理设置是否对阿里云的流量生效或造成了阻碍。可以尝试暂时关闭代理再测试。
调整语音识别高级选项：
- 在菜单栏选择 工具/选项 -> 高级选项。
- 在“语音识别调整”区域，尝试将“同时识别的字幕数”改为 1。这可以减少一次性发送给 API 的数据量，有时能解决特定 API 的处理问题。
- 如果仍然报错，请尝试将“语音识别切片间隔时间/秒”调整为 5 或 10，让软件将音频切分成更小的段再发送。
提供更详细的日志：
- 请再次提供 videotrans/logs/ 目录下最新的日志文件（文件名格式为 {年月日}.log）。这次，请务必在日志中找到并粘贴在您尝试使用 阿里百炼 Qwen3-ASR 识别时，从开始到报错的完整日志段。这能帮助我们了解软件在与阿里 API 交互时，具体的发送请求和接收响应的细节，从而更准确地判断是哪个环节出了问题。

Floor #4 2a0c:2500* reply at 9 months ago

语音识别阶段出错:[阿里百炼 Qwen3-ASR] InvalidParameter: InternalError.Algo.InvalidParameter: The audio is empty :
Traceback (most recent call last):
File "videotrans\task\job.py", line 112, in run
File "videotrans\task\_speech2text.py", line 91, in recogn
File "videotrans\recognition\__init__.py", line 198, in run
File "videotrans\recognition\_base.py", line 78, in run
File "tenacity\__init__.py", line 338, in wrapped_f
File "tenacity\__init__.py", line 477, in call
File "tenacity\__init__.py", line 378, in iter
File "tenacity\__init__.py", line 400, in
File "concurrent\futures\_base.py", line 439, in result
File "concurrent\futures\_base.py", line 391, in __get_result
File "tenacity\__init__.py", line 480, in call
File "videotrans\recognition\_qwen3asr.py", line 56, in _exec
videotrans.configure._except.StopRetry: InvalidParameter: InternalError.Algo.InvalidParameter: The audio is empty

Floor #5 0.0* reply at 9 months ago

本条内容由 gpt-5-mini 回复

您的问题仍然是 [阿里百炼 Qwen3-ASR] InvalidParameter: InternalError.Algo.InvalidParameter: The audio is empty。鉴于您之前反馈 SenseVoice 和 faster-whisper 本地模型均可正常使用，这强烈表明问题不在于视频音频本身或软件本地提取音频的能力，而在于与 阿里百炼 Qwen3-ASR 在线服务 的交互上。

请您再次仔细检查以下几点，并务必提供反馈和详细日志：

核对阿里百炼 Qwen3-ASR 密钥和区域设置：
- 在软件菜单栏，点击 语音识别设置。
- 确认您在 阿里百炼 Qwen3-ASR 渠道下填写的 AccessKey ID 和 AccessKey Secret 完全正确无误。即使是多一个空格或少一个字符都会导致认证失败。
- 确认选择的 Region (区域) 与您申请阿里百炼服务的区域一致。区域不匹配也会导致服务无法调用。
- 建议： 尝试重新输入密钥，或从阿里云后台重新生成/复制一次，确保准确性。
检查网络环境对阿里百炼 API 的访问：
- 您的网络环境是否能正常访问 阿里云 的服务接口？有时防火墙、路由器设置或代理软件可能会阻止或干扰对特定云服务 API 的连接。
- 如果您正在使用 网络代理，请尝试暂时关闭代理，或检查代理设置是否正确配置以允许 pyVideoTrans 访问阿里云的 API 地址。有时代理会拦截或修改请求，导致数据未能正确发送。
提供完整的日志文件：
- 这是解决问题的关键。请您在软件根目录下的 videotrans/logs/ 文件夹中，找到并上传 最新生成 的、包含此次错误发生时段的日志文件（文件名格式为 {年月日}.log）。
- 请提供从您点击开始识别到报错出现完整的日志内容。这份日志能详细记录软件与阿里百炼 API 交互的全过程，包括请求的细节和接收到的原始错误信息，这将帮助我们精准定位问题。

请务必按上述步骤检查并提供日志，这对于诊断 阿里百炼 Qwen3-ASR 特定问题至关重要。

Floor #6 39.87* reply at 9 months ago

Admin

内部bug，等后续修复吧

Floor #7 2a0c:2500* reply at 9 months ago

ok

Floor #8 0.0* reply at 9 months ago

本条内容由 gpt-5-mini 回复

根据 Admin 的最新回复，这个问题被定性为 内部 bug，并表示需要 等后续修复。

这意味着当前无法通过用户侧的配置调整或操作来解决。请您耐心等待 pyVideoTrans 软件的后续版本更新，开发者会在更新中修复此问题。

在此期间，您可以继续使用您反馈可以正常工作的 SenseVoice 或 faster-whisper 等本地语音识别渠道来完成您的任务。

#1007 videotrans.configure._except.StopRetry: InvalidParameter:<400> InternalError.Algo.InvalidParameter: The audio is empty

videotrans.configure._except.StopRetry: InvalidParameter: InternalError.Algo.InvalidParameter: The audio is empty

8 Replies

Post Your Reply

Related resource