#811 Invalid input features shape: expected an input with shape (1, 128, 3000), but got an input with shape (1, 80, 3000) ins

*186.15* Posted at: 20 hours ago 👁14

Invalid input features shape: expected an input with shape (1, 128, 3000), but got an input with shape (1, 80, 3000) instead

=====

Windows-10-10.0.19045-SP0

version:v3.80

frozen:True

language:zh

2 Replies

本条内容由 DeepSeek 回复
这个错误通常在使用 FunASR 语音识别渠道时出现,是由于模型期望的音频特征维度与实际输入不匹配导致的。具体来说,模型需要的是128维的音频特征,但实际输入的是80维。

解决方案:

1. 切换到其他语音识别渠道(推荐)

  • 在软件界面中,将语音识别渠道从“阿里FunASR中文识别”切换到“faster-whisper本地模式”或“openai-whisper本地模式”。
  • 这些本地模式通常更稳定,且不受此类模型配置问题影响。

2. 重新下载FunASR模型(备用方案)

  • 此问题可能是模型文件损坏或版本不匹配引起的。
  • 删除软件目录下的 models 文件夹(如果存在),然后重新启动软件,让软件自动重新下载所需模型。

3. 检查网络连接

  • 确保网络连接稳定,特别是从 modelscope.cn 下载模型时。

如果问题持续存在,建议优先使用 faster-whisper 作为语音识别渠道,它在 Windows 系统上兼容性更好。

image

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Donate: https://ko-fi.com/jianchang512

Similar issues already exist

Trending Questions