微软推出全球最高精度的语音转写模型 MAI-Transcribe-1
近日,微软宣布推出全新的语音转文字模型 MAI-Transcribe-1,该模型在 25 种语言上的平均词错误率(WER)仅为 3.9%,被誉为目前全球最精准的转写模型。这是微软自研的 MAI 系列模型中的第三款,之前还发布了语音合成模型 MAI-Voice-1 和图像生成模型 MAI-Image-...
近日,微软宣布推出全新的语音转文字模型 MAI-Transcribe-1,该模型在 25 种语言上的平均词错误率(WER)仅为 3.9%,被誉为目前全球最精准的转写模型。这是微软自研的 MAI 系列模型中的第三款,之前还发布了语音合成模型 MAI-Voice-1 和图像生成模型 MAI-Image-...
近日,苹果公司研究团队联合香港大学发表了名为《少用高斯函数,多用纹理:4K 前馈纹理飞溅》(Less Gaussians, More Textures:4K Feedforward Texture Splatting)的最新研究成果,推出了一项名为 LGTM 的全新技术框架。该技术旨在解决当前3D ...
据媒体报道,支撑庞大的 AI 数据中心运转,谷歌正计划在美国得克萨斯州建设一座巨型天然气发电厂。这一举动引发了外界对于大型科技公司能否兑现“零碳”承诺的深度质疑。核心规划:933 兆瓦“能源心脏”保障 AI 园区此次合作的双方为谷歌与能源公司 Crusoe Energy,项目核心细节如下:项目坐标:...
据媒体报道,由上海松应科技有限公司自主研发的 ORCA Lab 1.0 物理 AI 个人开发者平台 开发者版近日正式发布。这是我国首个专门面向个人开发者与轻量化团队的原生物理 AI 平台,标志着具身智能研发进入了“普惠化”时代。核心突破:零代码、低成本、单机运行针对当前具身智能产业化面临的高门槛、高...
4月2日,针对媒体关注的Meta收购人工智能初创企业Manus相关事宜,商务部新闻发言人何亚东在例行新闻发布会上做出正式回应。何亚东明确指出,中国政府一贯支持企业根据自身发展需要开展跨国经营与技术合作,但相关行为需严格遵守中国法律法规,并履行法定程序。此前,Facebook母公司Meta被曝正积极推...
谷歌于4月2日宣布为其企业级视频创作应用 Vids 引入重大升级,通过集成 Veo3.1视频生成模型与自然语言交互技术,实现从静态生成向动态“指令控制”的跨越。 此次更新的核心在于赋予 AI 虚拟形象更强的交互能力,用户仅需输入简单的文字提示,即可指挥形象在场景中完成与产品、道具或设备的特定互动,且...
微软公司正以前所未有的力度推进自研AI模型研发,旨在未来几年内构建起能与OpenAI和Anthropic并驾齐驱的前沿系统。微软AI负责人苏莱曼明确表示,公司的核心目标是打造行业内最尖端的模型。根据最新披露的战略规划,微软计划在 2027 年之前,使其自研模型在文本、图像以及音频处理能力上达到世界领...
谷歌正式推出了其新一代“开放”AI模型Gemma4。这一举动标志着谷歌在开源策略上的重大转向,旨在通过更宽松的协议吸引全球开发者。与之前备受批评的限制性自定义许可证不同,Gemma4选择了业界公认的 Apache2.0许可证。这种转变意味着开发者可以更加自由地使用、修改和分发该模型,消除了以往商业化...
北京时间4月3日凌晨,谷歌正式发布开源大模型 Gemma4,凭借“单位参数智能”的突破性提升,定义了开源模型辅助智能体工作流的新标准。该系列包含高效版 E2B(2.3B)、E4B(4.5B)以及高性能版26B MoE 与31B 稠密模型。作为基于 Gemini3技术栈构建的最新成果,Gemma4全系...
在 AI 视频赛道急流勇退后,OpenAI 正在开辟一条全新的“第二战线”。据媒体报道,在正式关闭 Sora 视频应用仅一个月后,OpenAI 宣布完成对知名科技商业播客 TBPN 的收购。这一动作发生在 TBPN 刚刚完成对苹果高管 Eddy Cue 的重磅采访之后,时机选择耐人寻味。战略转向:从...
近日,由 Anthropic 公司开发的 AI 终端工具 Claude Code 遭遇了严重的次生安全危机。由于之前约 51.3 万行前端源码因人为失误被意外公开,黑客群体已迅速跟进并布置了大量钓鱼陷阱。这些黑客在 GitHub 等技术社区建立了多个虚假代码仓库,试图利用开发者对泄露源码的好奇心实施...
据4月2日报道,由 Anthropic 人为失误导致的Claude Code 源码泄露事件仍在持续发酵。目前,已有黑客利用该热点在 GitHub 上通过虚假仓库传播名为 Vidar 的信息窃取恶意软件。诱饵升级:声称“解锁企业级功能”安全公司 Zscaler 的监测报告显示,一个名为 idbzoom...
语音人工智能巨头 ElevenLabs 于4月1日正式发布 iOS 应用 ElevenMusic,标志着该公司正式进军 AI 音乐创作与社交发现领域,直接参与 Suno 及 Udio 等平台的市场竞争。作为其音频生态布局的核心环节,ElevenMusic 允许用户通过自然语言提示词生成定制化音乐,并...
伊朗战争重创了全球石油市场,美国天然气价格大幅上涨。由于运输成本上涨,Amazon对使用其分销网络的卖家征收3.5% 的新燃油附加费。该政策可能会给依赖电子商务巨头销售产品的无数商家带来巨大的新成本。 Amazon告诉TechCrunch,附加费将在可预见的未来实施,尽管该公司表示将随着市场状况的...
销售减肥药和性健康处方的远程医疗公司Hims & Hers已确认影响其第三方客户服务平台的数据泄露事件。 这家医疗保健公司在周四向加州总检察长办公室提交的数据泄露通知中表示,黑客窃取了发送给该公司客户支持团队的用户请求数据。该公司表示,黑客在2月4日至7日期间侵入其第三方票务系统,窃取了大量支持票...
SpaceX在美国54年来首次将宇航员送上月球的同一天初创公司了IPO。而且时机也很合适:这可能是美国宇航局最后一次在没有来自风险投资支持的科技领域的公司的大力帮助的情况下尝试将人类送入深空。 美国宇航局当前的登月活动的起源可以追溯到布什第二届政府,当时布什政府开始开发一枚巨大的火箭和一艘名为“猎...
总部位于密尔沃基的风险投资公司Gateway Capital Partners告诉TechCrunch,该公司本周早些时候宣布了其2500万美元目标基金II的首次融资。 Gateway Capital拒绝透露首次收盘的具体金额。 首次交割意味着基金II可以开始其投资业务。 Gutherie表示,该...
OpenAI收购了热门科技行业脱口秀节目TBPN(科技商业编程网络),这是人工智能巨头首次收购媒体公司。该节目将向OpenAI的首席政治执行官Chris Lehane汇报。 TBPN由前科技创始人John Coogan和Jordi Hays主持,是一档每日直播节目,在YouTube和X上播出三个小...
Flipboard周四宣布推出社交网站,这是创作者和出版商在网络上建立自己的空间的一种新方式。 这些社交网站是围绕开放社交网络上已经发生的对话而构建的,其中包括Mastodon和Bluesky等去中心化平台以及其他公共网络内容。 Flipboard表示,社交网站将社交帖子、视频、播客、时事通讯和其...
语音AI公司ElevenLabs悄然发布了一款名为ElevenMusic的iOS应用程序,可以用来用AI创作音乐并发现AI生成的音乐,以便与Suno和Udio等平台竞争。 这款新应用程序在App Store上架了几周,最终于4月1日发布,这表明ElevenLabs不仅仅希望成为一家语音模型公司。该...