#4565 原视频是日语,用什么模型识别准确信最高包括联网的AI模型

2a02:6ea0* Posted at: 1 hour ago 👁8

原视频是日语,用什么模型识别准确信最高包括联网的AI模型

1 Replies

日语视频语音识别,推荐以下模型(准确度从高到低):

  • 本地模型faster-whisperopenai-whisper,选择 large-v3 模型(.en结尾的仅支持英语,勿选)。需开启 CUDA 加速。
  • 联网AI模型:OpenAI Whisper API(whisper-1)或 Gemini AI 语音识别,两者均支持日语且准确度很高。

如遇日语特殊口音或背景噪音,可勾选“降噪”提升效果。

请查阅相关文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource