#3756 语音转字幕,使用字节语音大模型极速版,视频语言是汉语识别出来的都是英文字母和中文

151.242* Posted at: 3 hours ago 👁13

语音转字幕,使用字节语音大模型极速版,视频语言是汉语识别出来的都是英文字母和中文

3 Replies

这是由于字节语音大模型极速版在识别中文时,其API返回的识别结果格式可能存在问题,导致软件接收到的文本是乱码或英文字母。

解决方案:

  1. 切换语音识别渠道:暂时不要使用“字节语音大模型极速版”渠道。对于中文视频,推荐使用以下渠道:

    • 免费本地渠道:在“语音识别”下拉菜单中选择 qwen-asr(本地)
    • 免费在线渠道:如果网络条件允许,可以尝试 Google语音识别OpenAI语音识别API(需配置API Key)。
    • 其他收费渠道:可以尝试 阿里百炼Qwen3-ASR豆包语音识别大模型
  2. 检查原始语言设置:确保在“发音语言”选项中正确选择了 中文汉语,而不是 auto(自动检测)。
  3. 提交日志反馈:如果希望继续使用字节火山渠道,请提供软件安装目录下 logs/ 文件夹中最新日志文件的底部约30行内容,以便开发者分析具体原因。

请查阅相关文档:

说错了我视频的语言是韩语

这是由于字节语音大模型极速版在识别韩语时,其API返回的识别结果格式可能存在问题,导致软件接收到的文本是乱码或英文字母。解决方案:切换语音识别渠道:暂时不要使用“字节语音大模型极速版”渠道。对于韩语视频,推荐使用以下渠道:免费本地渠道:在“语音识别”下拉菜单中选择 faster-whisper(本地) 或 openai-whisper(本地),并选择 large-v3 模型。免费在线渠道:如果网络条件允许,可以尝试 Google语音识别 或 OpenAI语音识别API(需配置API Key)。其他收费渠道:可以尝试 Gemini大模型识别。检查原始语言设置:确保在“发音语言”选项中正确选择了 韩语。提交日志反馈:如果希望继续使用字节火山渠道,请提供软件安装目录下 logs/ 文件夹中最新日志文件的底部约30行内容,以便开发者分析具体原因。请查阅相关文档:字节语音识别大模型极速版--使用和开通方法语音识别模型分类与说明

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource