#1007 videotrans.configure._except.StopRetry: InvalidParameter:<400> InternalError.Algo.InvalidParameter: The audio is empty

2409:8a28* Posted at: 1 day ago 👁34

语音识别阶段出错:[阿里百炼 Qwen3-ASR] InvalidParameter: InternalError.Algo.InvalidParameter: The audio is empty :
Traceback (most recent call last):
File "videotrans\task\job.py", line 112, in run
File "videotrans\task\_speech2text.py", line 91, in recogn
File "videotrans\recognition\__init__.py", line 198, in run
File "videotrans\recognition\_base.py", line 78, in run
File "tenacity\__init__.py", line 338, in wrapped_f
File "tenacity\__init__.py", line 477, in call
File "tenacity\__init__.py", line 378, in iter
File "tenacity\__init__.py", line 400, in
File "concurrent\futures\_base.py", line 439, in result
File "concurrent\futures\_base.py", line 391, in __get_result
File "tenacity\__init__.py", line 480, in call
File "videotrans\recognition\_qwen3asr.py", line 56, in _exec

videotrans.configure._except.StopRetry: InvalidParameter: InternalError.Algo.InvalidParameter: The audio is empty

Windows-10-10.0.26200-SP0
version:v3.81
frozen:True
language:zh

8 Replies

本条内容由 gpt-5-mini 回复

问题很可能是“语音文件为空或提取失败”,导致阿里百炼 Qwen3-ASR 返回 The audio is empty。请按下列步骤排查并修复:

  1. 验证源文件确实包含音频

    • 用播放器直接播放原始视频/音频,确认有声音且时长合理(不是完全静音或极短片段)。
    • 如果是纯背景音乐或没有人声,识别会失败(软件仅处理有人类语音的音视频)。
  2. 检查软件是否正确提取/准备了上传的音频(查看日志)

    • 打开软件根目录下的 videotrans/logs/,定位最近的 {年月日}.log,查看识别前后的日志条目,确认有没有 “提取音频” 或 “ffmpeg/音频切片” 类的错误或空文件提示。
    • 如果日志显示上传前音频长度为0或找不到音频,即为提取失败(需按步骤4处理)。
  3. 确认识别通道与模型状态

    • 如果选择的是本地模型(如 faster-whisper/本地whisper等),确认本地模型已下载并可用(本地模型首次使用需下载)。
    • 若使用在线阿里 Qwen3-ASR,检查当前识别通道是否正确配置(API Key/网络),并尝试切换到另一个识别通道以排除通道专有问题(例如切换到本地的 faster-whisper 测试能否成功)。
  4. 常见导致“音频为空”的具体原因与对应处理

    • 源文件路径或文件名中包含特殊字符/中文/空格:将媒体文件放到一个短且纯英文路径(或无空格路径)下重试。
    • 音频提取工具失败(可能是提取步骤被阻断):重启软件并重试任务,或用其他工具手动将视频导出为 wav 再用“音视频转字幕”功能测试识别。
    • 文件为极短或静音片段:用播放器检查音量波形,必要时重新生成/转码音频。
  5. 复现与并行/并发相关检查

    • 若同时进行多个识别任务或软件设置了较高并发,尝试只识别单个文件(或在“高级选项”中将并发数降到 1)后重试,看是否仍出现空音频错误。
  6. 若上述检查无效,请提供信息以便进一步分析

    • 把 videotrans/logs/ 目录下的最新一份日志文件粘贴或上传(尤其是包含该任务时间段的日志行)。
    • 附上出错时使用的识别通道名称(例:阿里百炼 Qwen3-ASR)、源文件名及其时长、软件版本(你已给出 v3.81,已记录)。

如果有日志我可以根据具体报错行给出更精确的修复步骤。

没用,sensevoice和fastwhisper都是可以的

本条内容由 gpt-5-mini 回复

您提到 SenseVoicefaster-whisper 这两个本地语音识别渠道可以正常使用,这表明视频的音频提取没有问题,且本地模型的运行环境是正常的。

这意味着问题出在 阿里百炼 Qwen3-ASR 服务的特定配置或与该服务交互的环节上。虽然错误提示是 The audio is empty,但这在其他识别渠道正常的情况下,通常是 阿里百炼 Qwen3-ASR 端在处理请求时,未能正确接收或解析音频数据,或者API密钥/认证问题导致服务拒绝,并返回了一个误导性的“音频为空”错误。

请尝试以下排查步骤:

  1. 检查阿里百炼 Qwen3-ASR 的 API 密钥和区域设置:

    • 在软件菜单栏选择 语音识别设置
    • 确保您为 阿里百炼 Qwen3-ASR 渠道填写的 AccessKey IDAccessKey Secret 是正确且有效的。
    • 同时,确认选择的 Region (区域) 与您的密钥和账户服务区域一致。不正确的密钥或区域可能导致 API 请求失败。
  2. 检查网络连接(针对阿里百炼 API):

    • 虽然您可以访问 HuggingFace (如果是下载模型,且已解决),但 阿里百炼 Qwen3-ASR 的 API 地址可能不同。请确保您的网络环境可以正常访问阿里云的相关 API 服务端点。
    • 如果您使用了代理,请检查代理设置是否对阿里云的流量生效或造成了阻碍。可以尝试暂时关闭代理再测试。
  3. 调整语音识别高级选项:

    • 在菜单栏选择 工具/选项 -> 高级选项
    • 在“语音识别调整”区域,尝试将“同时识别的字幕数”改为 1。这可以减少一次性发送给 API 的数据量,有时能解决特定 API 的处理问题。
    • 如果仍然报错,请尝试将“语音识别切片间隔时间/秒”调整为 510,让软件将音频切分成更小的段再发送。
  4. 提供更详细的日志:

    • 请再次提供 videotrans/logs/ 目录下最新的日志文件(文件名格式为 {年月日}.log)。这次,请务必在日志中找到并粘贴在您尝试使用 阿里百炼 Qwen3-ASR 识别时,从开始到报错的完整日志段。这能帮助我们了解软件在与阿里 API 交互时,具体的发送请求和接收响应的细节,从而更准确地判断是哪个环节出了问题。

语音识别阶段出错:[阿里百炼 Qwen3-ASR] InvalidParameter: InternalError.Algo.InvalidParameter: The audio is empty :
Traceback (most recent call last):
File "videotrans\task\job.py", line 112, in run
File "videotrans\task\_speech2text.py", line 91, in recogn
File "videotrans\recognition\__init__.py", line 198, in run
File "videotrans\recognition\_base.py", line 78, in run
File "tenacity\__init__.py", line 338, in wrapped_f
File "tenacity\__init__.py", line 477, in call
File "tenacity\__init__.py", line 378, in iter
File "tenacity\__init__.py", line 400, in
File "concurrent\futures\_base.py", line 439, in result
File "concurrent\futures\_base.py", line 391, in __get_result
File "tenacity\__init__.py", line 480, in call
File "videotrans\recognition\_qwen3asr.py", line 56, in _exec
videotrans.configure._except.StopRetry: InvalidParameter: InternalError.Algo.InvalidParameter: The audio is empty

本条内容由 gpt-5-mini 回复

您的问题仍然是 [阿里百炼 Qwen3-ASR] InvalidParameter: InternalError.Algo.InvalidParameter: The audio is empty。鉴于您之前反馈 SenseVoicefaster-whisper 本地模型均可正常使用,这强烈表明问题不在于视频音频本身或软件本地提取音频的能力,而在于与 阿里百炼 Qwen3-ASR 在线服务 的交互上。

请您再次仔细检查以下几点,并务必提供反馈和详细日志:

  1. 核对阿里百炼 Qwen3-ASR 密钥和区域设置:

    • 在软件菜单栏,点击 语音识别设置
    • 确认您在 阿里百炼 Qwen3-ASR 渠道下填写的 AccessKey IDAccessKey Secret 完全正确无误。即使是多一个空格或少一个字符都会导致认证失败。
    • 确认选择的 Region (区域) 与您申请阿里百炼服务的区域 一致。区域不匹配也会导致服务无法调用。
    • 建议: 尝试重新输入密钥,或从阿里云后台重新生成/复制一次,确保准确性。
  2. 检查网络环境对阿里百炼 API 的访问:

    • 您的网络环境是否能正常访问 阿里云 的服务接口?有时防火墙、路由器设置或代理软件可能会阻止或干扰对特定云服务 API 的连接。
    • 如果您正在使用 网络代理,请尝试暂时关闭代理,或检查代理设置是否正确配置以允许 pyVideoTrans 访问阿里云的 API 地址。有时代理会拦截或修改请求,导致数据未能正确发送。
  3. 提供完整的日志文件:

    • 这是解决问题的关键。请您在软件根目录下的 videotrans/logs/ 文件夹中,找到并上传 最新生成 的、包含此次错误发生时段的日志文件(文件名格式为 {年月日}.log)。
    • 请提供从您点击开始识别到报错出现 完整 的日志内容。这份日志能详细记录软件与阿里百炼 API 交互的全过程,包括请求的细节和接收到的原始错误信息,这将帮助我们精准定位问题。

请务必按上述步骤检查并提供日志,这对于诊断 阿里百炼 Qwen3-ASR 特定问题至关重要。

Admin

内部bug,等后续修复吧

ok

本条内容由 gpt-5-mini 回复

根据 Admin 的最新回复,这个问题被定性为 内部 bug,并表示需要 等后续修复

这意味着当前无法通过用户侧的配置调整或操作来解决。请您耐心等待 pyVideoTrans 软件的后续版本更新,开发者会在更新中修复此问题。

在此期间,您可以继续使用您反馈可以正常工作的 SenseVoice 或 faster-whisper 等本地语音识别渠道来完成您的任务。

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Donate: https://ko-fi.com/jianchang512

Trending Questions