时间:2025/8/24 15:47:49来源:www.a300.cn作者:学臣我要评论(0)
阿里通义正式推出新一代端到端语音识别大模型Fun-ASR,该模型通过强化上下文感知与高精度转写能力,在家装、保险等垂直行业场景中实现语音识别准确率超15%的突破性提升。实测数据显示,保险行业准确率较前代提升18%,家装、畜牧等领域增幅达15%-20%。
作为大语言模型驱动的语音识别算法,Fun-ASR采用自研语音算法与Qwen3监督微调技术,结合前沿模型架构与文本模态对齐技术,在保持语言处理优势的同时,集成RAG检索增强方案,支持超1000个自定义热词导入。该功能可自动匹配音频中的领域热词、历史文档及上下文记录,显著优化特定场景下的关键词识别效果。
针对语音识别中的噪声干扰、语种混淆及生成幻觉等痛点,研发团队创新性引入强化学习(RL)技术,通过动态优化策略减少识别误差,系统稳定性与可靠性获实质性提升。值得关注的是,模型在四川话、粤语、闽南语等方言识别中表现优于同类产品,同时适应远场拾音、近场降噪等复杂声学环境,覆盖会议室、工位、超市、户外等多元场景。
训练数据层面,Fun-ASR基于上亿小时音频数据构建,深度融合互联网、科技、畜牧、汽车等十余个领域的专业术语库。这一数据优势使其在垂直行业识别中展现出显著优势,例如在畜牧行业可精准识别牲畜叫声与环境噪声中的关键指令。
阿里通义技术团队表示,Fun-ASR的进化标志着语音识别技术从通用场景向专业化、场景化深度渗透。随着模型在更多行业落地,其动态热词更新与多模态交互能力将进一步推动语音交互效率革新。
相关视频
相关阅读 阿里和蚂蚁旗下22个品牌将共同投入资源 启动橙意计划升级骑士保障阿里和蚂蚁旗下22个品牌将共同投入资源 启动橙意计划升级骑士保障【乐天使体育app官网下载手机版 Fun官网下载】下载方法和评测汇总【fun88官网客服】下载方法和评测汇总2025【乐fun体育官网】下载方法和评测汇总2025【FUN888乐天使官网入口】下载方法和评测汇总2025【FUN888登录入口】下载方法和评测汇总2025【fun888登录入口最新版本更新】下载方法和评测汇总2025
热门文章
谷歌透露Gemini每次回
阿里和蚂蚁旗下22个品
雷军晒小米第一代手机
小米7月空调线上销量超
最新文章
阿里通义Fun-ASR语音模
小米16首发!曝澎湃OS
谷歌透露Gemini每次回答消耗能量:相当于微OriginOS 6 Beta版开启招募测试:vivo X200魅族高管回应魅族22再次延期:对品牌伤害很全球首款防尘折叠屏!谷歌Pixel 10 Pro Fol
人气排行 2014年双11淘宝销售额及排行榜扫描文件怎么转换成word 扫描文件转换成wor如何将pdf转换成jpg pdf转jpg图文教程360粉碎文件如何恢复win7回收站清空了怎么恢复 win7回收站清空恢pdf怎么转换成excel pdf文件转Excel格式方法设备管理器有叉号、问号、感叹号?驱动人生迅捷pdf转换成word转换器怎么用
查看所有0条评论>>