#3827 Application started at 2026-03-28 02:39:39 PIL\Image.py:116: RuntimeWarning: The _imaging extension was built for anothe

103.172* Posted at: 3 hours ago 👁6


Application started at 2026-03-28 02:39:39

PIL\Image.py:116: RuntimeWarning: The _imaging extension was built for another version of Pillow or PIL:
Core version: 12.1.0
Pillow version: 12.1.1
if version != getattr(core, "PILLOW_VERSION", None):
First searching GPU...
[DEBUG] 返回缓存的编解码器 Windows-264: h264_nvenc
[DEBUG] 返回缓存的编解码器 Windows-265: hevc_nvenc
NVIDIA_GPU_NUMS=1
Found 1 GPUs, cost=4s
start workers...
process_max_gpu=1
multi_gpus=False
Concurrent task_nums=1
process_max=1
start 9 jobs
ended workers
[DEBUG] 最终配置信息:self.cfg=TaskCfgVTT(is_cuda=True, uuid='75315f3d67', cache_folder='G:/VideoTrans/Trans/win-pyvideotrans-v3.98-327/tmp/27784/75315f3d67', target_dir='C:/Users/lsl/Downloads/_video_out/Namnung and Sunny tiktok live #namnung #sunny-mp4', source_language='泰国语', source_language_code='th', source_sub='C:/Users/lsl/Downloads/_video_out/Namnung and Sunny tiktok live #namnung #sunny-mp4/th.srt', source_wav='G:/VideoTrans/Trans/win-pyvideotrans-v3.
......
...
正在等待线程 DiarizSpeaker 结束...
正在等待线程 TranslationSRT 结束...
正在等待线程 DubbingSrt 结束...
正在等待线程 SpeechToText2 结束...
正在等待线程 AlignVieoAudioSrt 结束...
正在等待线程 AssembVideoAudioSrt 结束...
正在等待线程 TaskDone 结束...
Successfully killed ffmpeg processes using taskkill


Application started at 2026-03-28 02:46:53

PIL\Image.py:116: RuntimeWarning: The _imaging extension was built for another version of Pillow or PIL:
Core version: 12.1.0
Pillow version: 12.1.1
if version != getattr(core, "PILLOW_VERSION", None):
First searching GPU...
[DEBUG] 返回缓存的编解码器 Windows-264: h264_nvenc
[DEBUG] 返回缓存的编解码器 Windows-265: hevc_nvenc
NVIDIA_GPU_NUMS=1
Found 1 GPUs, cost=3s
start workers...
process_max_gpu=1
multi_gpus=False
Concurrent task_nums=1
process_max=1
start 9 jobs
ended workers
[DEBUG] 最终配置信息:self.cfg=TaskCfgVTT(is_cuda=True, uuid='e0435808cb', cache_folder='G:/VideoTrans/Trans/win-pyvideotrans-v3.98-327/tmp/27948/e0435808cb', target_dir='C:/Users/lsl/Downloads/_video_out/Namnung and Sunny tiktok live #namnung #sunny-mp4', source_language='泰国语', source_language_code='th', source_sub='C:/Users/lsl/Downloads/_video_out/Namnung and Sunny tiktok live #namnung #sunny-mp4/th.srt', source_wav='G:/VideoTrans/Trans/win-pyvideotrans-v3.98-327/tmp/27948/e0435808cb/th.wav', source_wav_output='C:/Users/lsl/Downloads/_video_out/Namnung and Sunny tiktok live #namnung #sunny-mp4/th.m4a', target_language='简体中文', target_language_code='zh-cn', target_sub='C:/Users/lsl/Downloads/_video_out/Namnung and Sunny tiktok live #namnung #sunny-mp4/zh-cn.srt', target_wav='G:/VideoTrans/Trans/win-pyvideotrans-v3.98-327/tmp/27948/e0435808cb/target.wav', target_wav_output='C:/Users/lsl/Downloads/_video_out/Namnung and Sunny tiktok live #namnung #sunny-mp4/zh-cn.m4a', name='C:/Users/lsl/Downloads/Namnung and Sunny tiktok live #namnung #sunny.mp4', noextname='Namnung and Sunny tiktok live #namnung #sunny', basename='Namnung and Sunny tiktok live #namnung #sunny.mp4', ext='mp4', dirname='C:/Users/lsl/Downloads', shound_del_name=None, translate_type=1, tts_type=0, volume='+0%', pitch='+0Hz', voice_rate='+0%', voice_role='No', voice_autorate=False, video_autorate=False, remove_silent_mid=False, align_sub_audio=True, detect_language='th', recogn_type=0, model_name='large-v3', shibie_audio=None, remove_noise=False, enable_diariz=False, nums_diariz=0, rephrase=0, fix_punc=False, subtitle_language=None, app_mode='biaozhun', subtitles='', targetdir_mp4='C:/Users/lsl/Downloads/_video_out/Namnung and Sunny tiktok live #namnung #sunny-mp4/Namnung and Sunny tiktok live #namnung #sunny.mp4', novoice_mp4='G:/VideoTrans/Trans/win-pyvideotrans-v3.98-327/tmp/27948/e0435808cb/novoice.mp4', is_separate=False, instrument=None, vocal=None, back_audio='', clear_cache=True, background_music=None, subtitle_type=1, only_out_mp4=False, recogn2pass=False, output_srt=0, copysrt_rawvideo=False)

[DEBUG] [recognition]__init__:kwargs={'detect_language': 'th', 'audio_file': 'G:/VideoTrans/Trans/win-pyvideotrans-v3.98-327/tmp/27948/e0435808cb/th.wav', 'cache_folder': 'G:/VideoTrans/Trans/win-pyvideotrans-v3.98-327/tmp/27948/e0435808cb', 'model_name': 'large-v3', 'uuid': 'e0435808cb', 'is_cuda': True, 'subtitle_type': 1, 'recogn_type': 0, 'max_speakers': -1, 'llm_post': False, 'recogn2pass': False}
[DEBUG] BaseRecogn 初始化


Application started at 2026-03-28 02:54:31

PIL\Image.py:116: RuntimeWarning: The _imaging extension was built for another version of Pillow or PIL:
Core version: 12.1.0
Pillow version: 12.1.1
if version != getattr(core, "PILLOW_VERSION", None):
First searching GPU...
[DEBUG] 返回缓存的编解码器 Windows-264: h264_nvenc
[DEBUG] 返回缓存的编解码器 Windows-265: hevc_nvenc
NVIDIA_GPU_NUMS=1
Found 1 GPUs, cost=3s
start workers...
process_max_gpu=1
multi_gpus=False
Concurrent task_nums=1
process_max=1
start 9 jobs
ended workers
为什么我的这个cuda选择了,用的largeV3,语音识别就是识别时间长就算了,还识别不出来,又不报错,什么鬼啊,如何弄

3 Replies

这是由于使用大型模型 large-v3 进行泰语语音识别时,可能因模型对小语种支持不足、硬件资源限制或参数设置不当导致识别过程缓慢且无结果。

请按以下步骤排查和解决:

  1. 更换语音识别模型

    • large-v3 模型对泰语等小语种的支持可能不如英语或中文。建议尝试使用对多语言支持更好的在线AI识别渠道。
    • 最佳配置:在“语音识别”下拉菜单中,选择 Gemini大模型识别OpenAI语音识别API(均为收费渠道)。如果希望免费,可尝试 Qwen-ASR(本地)阿里百炼 Qwen3-ASR(对中文及部分亚洲语言优化)。
  2. 调整本地模型参数(如果坚持使用 faster-whisper

    • 进入 菜单 -> 工具 -> 高级选项
    • 【语音识别参数】 区域进行如下调整,以降低资源消耗并提高稳定性:

      • CUDA数据类型:从 float32 改为 float16int8
      • 识别准确度beam_size识别准确度best_of:均从 5 改为 1
      • 启用上下文感知:确保此项为 未选中 状态。
    • 返回主界面,确保 “发音语言” 已正确选择为 “泰国语”
  3. 检查CUDA环境与显存

    • 日志显示 is_cuda=True,说明软件已尝试使用GPU。请确认您的CUDA版本为 12.8,并已安装匹配的cuDNN。
    • 在CMD中输入 nvidia-smi 查看显存使用情况。large-v3 模型需要约10GB显存。如果显存不足,请更换为 mediumsmall 模型。
  4. 验证视频音频

    • 确保视频文件含有清晰的泰语音轨,背景噪音不过大。可以尝试勾选 “降噪” 选项。
  5. 强制重新识别

    • 在主界面左上角,勾选 清理已生成 复选框,以清除缓存并强制软件重新进行语音识别。

请查阅相关文档:

模型下载不完整,请删除目录 G:/VideoTrans/Trans/win-pyvideotrans-v3.98-327/models/models--Systran--faster-whisper-large-v3,重新下载

system:Windows-10-10.0.22631-SP0
version:v3.98
frozen:True
language:zh
root_dir:G:/VideoTrans/Trans/win-pyvideotrans-v3.98-327

这是由于模型文件下载不完整或损坏导致的。请手动下载并放置模型文件。

  1. 删除指定目录:按照提示,删除 G:/VideoTrans/Trans/win-pyvideotrans-v3.98-327/models/models--Systran--faster-whisper-large-v3 这个文件夹。
  2. 手动下载模型

  3. 创建并放置模型文件夹

    • G:/VideoTrans/Trans/win-pyvideotrans-v3.98-327/models/ 目录下,新建一个名为 models--Systran--faster-whisper-large-v3 的文件夹
    • 将第2步下载的所有文件复制到这个新文件夹内。
  4. 重新运行软件:完成文件复制后,重新启动 pyVideoTrans 并尝试翻译任务。

请查阅相关文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource