首页
读书
网课
《人工智能》目录


正文

阿里通义实验室最新发布了开源语音大模型项目 FunAudioLLM,包含两个模型:SenseVoice 和 CosyVoice。SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测,支持超过 50 种语言,效果优于 Whisper 模型,中文与粤语识别提升 50% 以上。CosyVoice 则专注于自然语音生成,支持中英日粤韩 5 种语言的生成,能够在 3~10 秒内生成模拟音色,并支持细粒度的情感和韵律控制。FunAudioLLM 的发布标志着阿里在语音生成领域的重大突破。


上一篇: 没有了
下一篇: 没有了
圣贤书院