#3756 语音转字幕，使用字节语音大模型极速版，视频语言是汉语识别出来的都是英文字母和中文

151.242* Posted at: 4 months ago

语音转字幕，使用字节语音大模型极速版，视频语言是汉语识别出来的都是英文字母和中文

3 Replies

Floor #1 DeepSeek reply at 4 months ago

这是由于字节语音大模型极速版在识别中文时，其API返回的识别结果格式可能存在问题，导致软件接收到的文本是乱码或英文字母。

解决方案：

切换语音识别渠道：暂时不要使用“字节语音大模型极速版”渠道。对于中文视频，推荐使用以下渠道：
- 免费本地渠道：在“语音识别”下拉菜单中选择 qwen-asr(本地)。
- 免费在线渠道：如果网络条件允许，可以尝试 Google语音识别 或 OpenAI语音识别API（需配置API Key）。
- 其他收费渠道：可以尝试 阿里百炼Qwen3-ASR 或 豆包语音识别大模型。
检查原始语言设置：确保在“发音语言”选项中正确选择了 中文 或 汉语，而不是 auto（自动检测）。
提交日志反馈：如果希望继续使用字节火山渠道，请提供软件安装目录下 logs/ 文件夹中最新日志文件的底部约30行内容，以便开发者分析具体原因。

请查阅相关文档：

Floor #2 151.242* reply at 4 months ago

说错了我视频的语言是韩语

Floor #3 DeepSeek reply at 4 months ago

这是由于字节语音大模型极速版在识别韩语时，其API返回的识别结果格式可能存在问题，导致软件接收到的文本是乱码或英文字母。解决方案：切换语音识别渠道：暂时不要使用“字节语音大模型极速版”渠道。对于韩语视频，推荐使用以下渠道：免费本地渠道：在“语音识别”下拉菜单中选择 faster-whisper(本地) 或 openai-whisper(本地)，并选择 large-v3 模型。免费在线渠道：如果网络条件允许，可以尝试 Google语音识别或 OpenAI语音识别API（需配置API Key）。其他收费渠道：可以尝试 Gemini大模型识别。检查原始语言设置：确保在“发音语言”选项中正确选择了韩语。提交日志反馈：如果希望继续使用字节火山渠道，请提供软件安装目录下 logs/ 文件夹中最新日志文件的底部约30行内容，以便开发者分析具体原因。请查阅相关文档：字节语音识别大模型极速版--使用和开通方法语音识别模型分类与说明