#3471 numpy.core._exceptions._ArrayMemoryError: Unable to allocate 1022. MiB for an array with shape (267894784,) and data typ

113.12* Posted at: 6 hours ago 👁9

Traceback (most recent call last):
File "videotrans\process\stt_fun.py", line 432, in faster_whisper
File "faster_whisper\transcribe.py", line 876, in transcribe
File "faster_whisper\audio.py", line 69, in decode_audio
numpy.core._exceptions._ArrayMemoryError: Unable to allocate 1022. MiB for an array with shape (267894784,) and data type float32


=
system:Windows-10-10.0.19045-SP0
version:v3.97
frozen:True
language:zh
root_dir:E:/videotrans-v3.84

1 Replies

这是由于内存不足导致无法加载音频数据。错误显示无法分配约 1GB 的内存给一个形状为 (267894784,) 的 float32 数组,这通常发生在处理大型音频文件时,且系统可用内存不足。

解决方案:

  1. 检查并关闭其他占用内存的程序:关闭不必要的浏览器标签页、大型软件(如 Photoshop、游戏等),释放系统内存。
  2. 降低处理文件的规模:如果视频/音频文件非常大,尝试先将其分割成较小的片段进行处理。
  3. 调整软件设置

    • 在“语音识别”阶段,尝试使用更小的 faster-whisper 模型(例如 mediumsmall,而非 large-v3)。
    • 在“菜单-工具-高级选项-语音识别参数”中,尝试降低 识别准确度beam_size识别准确度best_of 的值(例如设为 1),以减少内存消耗。
    • 确保已正确配置 CUDA 并启用 GPU 加速,以将计算负载从内存转移到显存(如果显卡支持)。在 CMD 中输入 nvcc -Vnvidia-smi 验证。
  4. 增加虚拟内存:在 Windows 系统中适当增加页面文件大小,为系统提供更多可用“内存”。
  5. 升级硬件:如果经常处理大型文件,考虑增加物理内存(RAM)。

请注意:您使用的软件根目录是 E:/videotrans-v3.84,但日志显示版本为 v3.97。请确保您运行的是从 E:/videotrans-v3.84 目录解压/更新的完整版本,而非旧版本或路径混乱的版本。如果问题持续,请提供 logs 文件夹中最新日志文件的更多内容(特别是错误发生前的上下文)。

请查阅相关文档:

Post Your Reply