2025年8月

阿里通义正式推出新一代端到端语音识别大模型Fun-ASR,该模型通过强化上下文感知与高精度转写能力,在家装、保险等垂直行业场景中实现语音识别准确率超15%的突破性提升。实测数据显示,保险行业准确率较前代提升18%,家装、畜牧等领域增幅达15%-20%。

作为大语言模型驱动的语音识别算法,Fun-ASR采用自研语音算法与Qwen3监督微调技术,结合前沿模型架构与文本模态对齐技术,在保持语言处理优势的同时,集成RAG检索增强方案,支持超1000个自定义热词导入。该功能可自动匹配音频中的领域热词、历史文档及上下文记录,显著优化特定场景下的关键词识别效果。

阿里通义新一代语音模型Fun-ASR再进化 垂直领域识别准确率提升超15%

针对语音识别中的噪声干扰、语种混淆及生成幻觉等痛点,研发团队创新性引入强化学习(RL)技术,通过动态优化策略减少识别误差,系统稳定性与可靠性获实质性提升。值得关注的是,模型在四川话、粤语、闽南语等方言识别中表现优于同类产品,同时适应远场拾音、近场降噪等复杂声学环境,覆盖会议室、工位、超市、户外等多元场景。

训练数据层面,Fun-ASR基于上亿小时音频数据构建,深度融合互联网、科技、畜牧、汽车等十余个领域的专业术语库。这一数据优势使其在垂直行业识别中展现出显著优势,例如在畜牧行业可精准识别牲畜叫声与环境噪声中的关键指令。

阿里通义技术团队表示,Fun-ASR的进化标志着语音识别技术从通用场景向专业化、场景化深度渗透。随着模型在更多行业落地,其动态热词更新与多模态交互能力将进一步推动语音交互效率革新。


什么?人工智能(AI)竟然可以预测聚变点火的成功率,还登上了权威科学期刊 Science!

这听起来有点像科幻电影中的情节,但它却已经真真实实地发生了——

这一生成式机器学习模型,由美国劳伦斯利弗莫尔国家实验室构建,以超过 70% 的概率预测了美国国家点火装置(NIF)的一次聚变点火实验结果,即“成功点火”。其中,点火(ignition)是指聚变产生的能量超过用于实验的激光能量。

论文链接:www.science.org/doi/10.1126/science.adm8201

这一发现可能为未来从事惯性约束聚变(ICF)实验的研究人员提供指导。ICF 实验利用高能激光压缩并加热氢同位素胶囊,以引发产生聚变能的核反应,是能源短缺时代的一种高效能源解决方案。想象一下,把地球上最强大的激光系统对准一个微小的氢胶囊,让它释放出巨大的能量,就像掌握了微型太阳。

研究人员表示,拥有“成功的预测模型”将为聚变能研究人员提供启示,帮助他们调整实验设计,并判断未来提升激光能量及其他变量是否能够改善聚变产出与效率。

聚变点火预测,为何重要?
ICF 项目旨在利用全球最大的激光系统 NIF,压缩并加热一个含有氢同位素氘和氚(D-T)的毫米级胶囊。在压缩过程中,D-T 燃料中的核反应会释放出聚变能量。

短短两个月前,我们还在感叹 31 家 AI 小团队的高效表现,当时团队平均规模仅 20 人,人均创造收入高达 279 万美元。如今,再度审视 Henry Shi 发布的最新榜单,我们发现 AI 小团队生态中又涌现出十款取得商业成功的产品,覆盖 AI 视频、AI 游戏、甚至 AI“团购”平台。 仔细分析这些新上榜团队,我们注意到一个明显趋势: 成功的小团队越来越倾向于去聚焦能直接衡量成果的业务环节,而非停留在单纯的工具或技术展示上。例如,GrowthX 以真人+AI“直接交付营销结果”为目标,替代单纯卖营销内容的写作工具;Pump.co 通过集体议价直接省下云成本,而非只做技术层面的优化——这类“结果导向”的团队,普遍更快地实现了规模化收入增长。 在创作者工具上也出现类似转向:Hanabi AI 选择聚焦语音情绪表现力这一价值感明确的方向;AI 视频这一边,Creati 明确赋能营销的定位,不卷花里胡哨的功能,主打上传商品图、套上模版即刻生成可用社媒内容;Higgsfield 则敏锐洞察到激增的短剧创作需求,从轻量化、娱乐向的 AI 视频应用转为专攻电影镜头语言的 AI 视频创作平台。

站在赛场,就是成功。
或许,本届运动会本就不是为了寻找“第一名”。“用竞技规则倒逼技术突破,用市场关注反哺产业发展”。这场运动会哨声响起,人形机器人企业会在产业坐标系里找到属于自身的落地方位。

首届人形机器人运动会藏着不少心思。

先来看看开幕式,所有节目均由人类和人形机器人互相配合完成。胡兵和一众人形机器人走秀、武术少年、戏曲小演员和人形机器人同台等。诸多节目都在呈现人类与人形机器人的共振和鸣,谱写“人机协同时代”的前奏。

当然,在开幕式中,也存在不少插曲,有失足跌倒也有宕机被拎着走的。或许比赛中也会存在失误,但其并不是“负面新闻”,而是通过暴露出“不确定性”或者badcase,在真实环境中发现问题、解决问题,促进长效发展。

这并不是一场竞技,而是我们窥见未来的窗口。

图片来源:人形机器人运动会

这场盛会于8月15—17日在国家速滑馆举办,参赛方多达127个品牌,汇聚500余台人形机器人。据了解,来自全球五大洲16个国家的280支队伍将会参赛,涵盖192支高校赛队和88支企业赛队。

与马拉松赛不同的是,这场运动会没有特长程的项目。相较半马比拼耐力,更考验硬件、本体结构设计,运动会的热门竞技项目主要是短程项目和群体项目,像百米、跨障、跳远等,所依仗的是爆发力和身体协调性,而多机足球赛则考验机器人之间的群体协同与智慧。

表演赛和场景赛则着重考察人形机器人的实用技能和智能化水平,探索机器人的落地方向。