智谱今日正式发布并开源了专业级 OCR 模型 GLM-OCR。该模型以0.9B 的轻量化尺寸实现了跨级性能突破,在多项权威基准测试中登顶,旨在解决复杂文档解析中的真实业务痛点。

核心性能:小尺寸下的 SOTA 表现

尽管参数规模仅为0.9B,但 GLM-OCR 的表现惊人。在权威文档解析榜单 OmniDocBench V1.5 中,它以 94.6分的高分夺冠,其性能已逼近通用大模型 Gemini-3-Pro。无论是在文本识别、数学公式推导、复杂表格解析,还是关键信息抽取(KIE)方面,均取得了 SOTA(业内最顶尖)表现。

场景突破:直击复杂文档痛点

GLM-OCR 针对六大高难业务场景进行了专项优化,表现稳健:

  • 复杂表格: 支持合并单元格与多层表头,可直接输出标准 HTML 代码。

  • 结构化提取: 智能识别卡证票据,输出标准 JSON 格式。

  • 手写体与代码: 完美兼容教育科研中的手写公式及程序员的代码截图。

  • 特殊标识: 具备极高的印章识别与多语言混排处理能力。

极致效率:推理更快,成本更低

在效率与成本控制上,GLM-OCR 展现了极强的商业竞争力:

  • 极速推理: PDF 处理吞吐量达 1.86页/秒,显著优于同类模型;支持 vLLM、Ollama 等主流部署方式。

  • 极致性价比: API 价格低至 0.2元/百万 Tokens。相比传统 OCR 方案,成本仅为其1/10,处理一千张 A4扫描件仅需约0.5元。

技术揭秘:多模态架构与强化学习

GLM-OCR 继承自 GLM-V 系列架构,集成自研 CogViT 视觉编码器。通过引入**多 Tokens 预测损失(MTP)**与全任务强化学习,模型在复杂版面下的泛化能力显著提升。其独特的4倍下采样策略与 SwiGLU 机制,确保了视觉信息与语言解码器的高效融合。

目前,GLM-OCR 已在GitHubHugging Face同步开源,智谱开放平台也已上线相关 API 及优惠包。

在当今数字化快速发展的时代,AI 助手的需求日益增加。然而,随着应用程序的复杂性不断提升,安全性问题也愈发突出。就在 OpenClaw 广受欢迎之时,一位开发者意识到了其局限性,并推出了 NanoClaw—— 一款基于 Apple 容器技术的轻量级 AI 助手。

NanoClaw 的诞生源于对 OpenClaw 的高度评价,但同时也指向其在模块复杂性和安全性方面的不足。OpenClaw 拥有超过52个模块和45个依赖项,采用的共享内存模型使得所有程序都在同一个 Node.js 进程中运行,安全性难以保障。而 NanoClaw 则通过在 Apple 容器中运行 Claude 助手,采用单进程架构,确保了程序之间的有效隔离。

NanoClaw 的核心理念是通过操作系统级别的隔离来提升安全性,而不是依赖应用级权限。它不仅将代码库简化至原先的8分钟即可理解,而且专为 Claude 助手构建,提供了独特的功能,如 WhatsApp 集成和定时任务。每个用户的上下文都被安全隔离,确保了隐私和数据的安全。

NanoClaw 的设计理念强调 “小到可以理解”,即用户能够轻松上手,并进行个性化定制,而不需要繁琐的配置文件。它特别适用于 macOS 系统,并要求 macOS Tahoe 或更高版本,使得使用体验更加流畅。

值得注意的是,虽然 NanoClaw 基于 Apple 容器技术,但开发者表示,如果用户需要在 Linux 系统上运行,也可以通过 Claude 进行相应的操作。同时,NanoClaw 确保代理程序在容器中运行,不受应用层权限的限制,访问权限明确,让用户对安全性更有信心。

总的来说,NanoClaw 是 OpenClaw 的极简、安全替代品,牺牲了一些多平台的灵活性,但换来了对 Claude 助手的更深入集成和更强的安全隔离,满足了用户对安全与便利的双重需求。

苹果公司CEO 蒂姆·库克(Tim Cook)在周四举行的全体员工大会上发表了重要演讲。在此次内部交流中,库克不仅针对近期备受关注的 AI 技术布局、CEO 接班人规划等核心议题进行了正面回应,还向员工展示了公司未来十年的战略雄心。

在谈及 AI 这一科技浪潮时,库克表现出了极大的信心。他将其定义为“一生中最具深刻影响的机遇之一”,并直言苹果具备独特的优势,能够以更有意义的方式帮助客户运用 AI 技术。针对外界对苹果在 AI 领域竞争力的担忧,库克表示,AI 将催生全新的产品和服务类别,这正为苹果开启前所未有的机遇大门。

除了技术布局,库克此次罕见地公开谈论了公司的“接班人”问题。他透露,自己花费了大量时间思考未来五年、十年乃至十五年后的领导层架构。近期苹果多位高管宣布退休,库克解释称这是经过精心安排的自然更替,并非突发状况,并强调制定长期的领导力计划是公司稳定发展的基石。

针对目前困扰科技行业的硬件供应链问题,库克坦诚公司正面临内存芯片短缺的挑战。目前,苹果首席运营官正带领团队评估并实施多项备选方案,以确保产品供应的稳定性。

此外,库克还回顾了公司创纪录的业绩表现,并预告苹果将在今年 4 月举行隆重的 50 周年庆祝活动。在海外市场方面,他特别点名了印度和马来西亚等新兴市场,认为这些地区蕴含着巨大的增长潜力。

划重点:

  • 🤖 AI战略核心化:库克坚信 AI 是当下的核心机遇,苹果将通过软硬件结合推出全新的 AI 产品类别。

  • 👥 接班人计划透明化:库克透露正在进行长达 15 年跨度的领导力规划,强调高管变动属于有计划的自然更替。

  • ⚠️ 应对供应链挑战:承认内存芯片短缺问题,目前已启动多套备选方案,由顶尖团队协同解决供应困境。




埃隆·马斯克最新播客节目中抛出了一个惊人观点:由于地球电力增长陷入停滞,未来 3 年内,太空将成为部署人工智能(AI)成本最低且效率最高的地方。这一言论再次将“太空GPU”这一前沿话题推向了全球资本市场的风口浪尖。

马斯克指出,目前全球正面临严峻的电力瓶颈。相比于呈指数级增长的芯片产出,电力产出的增长几乎持平。他大胆预言,到 2026 年底,人类可能会面临“空有芯片山,却无足够电力开机”的窘境。而在太空中,太阳能电池板的发电效率是地面上的 5 倍,且无需昂贵的储能电池来度过夜晚,这使得太空部署在经济性上具有压倒性优势。

除了能源优势,马斯克还谈到了地面建设的繁杂审批手续。他认为在地面大规模扩张电力设施极其困难,而太空部署则能免去这些行政束缚。他预计,这种成本结构的彻底倒挂将在 30 到 36 个月内发生。对于外界担忧的维护问题,他表示芯片在地面完成初始调试后可靠性极高,太空维护并不会成为核心障碍。

针对目前数据中心的运营压力,马斯克披露了xAI孟菲斯数据中心的细节:仅制冷一项就增加了40%的电力消耗。此外,美国昂贵的光伏关税和稀缺的本土产能也限制了地面电力的扩张。马斯克最后提到,为了实现这一愿景,未来的TeraFab工厂可能需要实现从逻辑芯片到存储及封装的全流程自产,以应对内存芯片价格暴涨带来的挑战。

划重点:

  • 🌌 太空部署性价比登顶:马斯克预测 36 个月内,由于太空光照效率更高且无需电池储备,其AI部署成本将远低于地面。

  • 全球面临电力瓶颈:地面电力增长无法跟上芯片产出, 2026 年底可能出现因缺电导致大型计算集群无法开机的现象。

  • 🏗️ 产业链纵向整合:为克服燃气轮机买不到及内存价格高昂等困难,马斯克计划让其工厂自产逻辑与存储芯片,并实现自主封装。

当地时间 2 月 5 日,OpenAI 推出了其最新的编码模型 ——GPT-5.3-Codex。这款模型在之前的版本 GPT-5.2-Codex 的基础上进行了重大升级,不仅提升了编码性能,还融合了更强的推理能力和专业知识,让它在复杂任务的处理上展现出更大的潜力。

GPT-5.3-Codex 实现了性能的 “双飞跃”,运行速度更是提升了 25%。这样的提升使得它能够高效地处理各种长期任务,尤其是在涉及研究和工具使用等复杂场景时表现得尤为出色。用户在使用 GPT-5.3-Codex 时,能够像与同事协作一样,实时引导和互动,从而保持上下文的连贯性。这一创新让用户体验更加流畅,为开发者和研究者提供了更为强大的支持。

OpenAI 的这项技术进步,不仅让编码变得更加高效,还可能改变开发者与 AI 之间的互动方式。在如今快速发展的科技环境中,能够实现更高效的工作流程,无疑将使企业和个人在竞争中脱颖而出。

此外,OpenAI 并未止步于此。为了进一步扩大其在市场上的影响力,OpenAI 正积极招聘数百名 “前沿部署工程师”,旨在赢得大型企业的业务。这一策略显示了 OpenAI 对未来的雄心壮志,力求在 AI 行业中继续保持领先地位。

随着 GPT-5.3-Codex 的发布,OpenAI 再次向我们展示了人工智能的无限可能,未来将会是一个充满机遇与挑战的时代。


2026年2月5日,Anthropic 正式发布了新一代旗舰模型 Claude Opus4.6。此次更新距离上一代 Opus4.5仅时隔两个月,展现了 Anthropic 极快的迭代速度,其核心进化方向锁定在“自主性”与“任务持久力”上。

核心突破:100万上下文与更强的“自主意识”

Claude Opus4.6不再仅仅是一个对话工具,它正向着具备“自主意识”的智能体(Agent)进化:

超大上下文窗口:首次在 Opus 级别模型中引入100万 token 的超大上下文窗口(测试版),能够轻松吞下整个代码库或海量财务报表。

任务持久力(Agentic tasks):模型在处理复杂任务时表现出更强的专注度,能够主动发现并修正错误,显著减少了用户与 AI 之间的往复指令,实现“少说多产”。

代码全流程进化:在代码规划、调试及审查能力上实现显著提升,是开发者应对大规模代码库的可靠伙伴。

办公神器:深度集成 Excel 与 PowerPoint

为了让 AI 真正落地办公场景,Claude Opus4.6带来了极具杀伤力的功能:

财务与图表自动化:升级了现有的 Excel 集成,能自主运行复杂的财务分析并生成电子表格。

PPT 制作预览:推出了 PowerPoint 集成的研究预览版,AI 可以根据行业研究结果自动创建演示文稿,包揽从数据整理到视觉呈现的全流程。

加量不加价:定价保持平稳

尽管性能大幅跃升,Anthropic 依然维持了极具竞争力的定价方案:

输入成本:每百万 token5美元。

输出成本:每百万 token25美元。

目前,Claude Opus4.6已在官方 API、claude.ai 网页版及主流云平台同步上线,用户可以即刻体验这款专注编程与专业办公的“最强大脑”。

 随着2026年春节临近,国内领先的AI应用千问APP于今日正式宣布开启“春节30亿大免单”系列活动。首波福利直击年轻消费群体,以“请全国人民喝奶茶”为主题,力求通过AI技术与生活服务的深度融合,为用户带来科技感十足的新春贺礼。

据官方发布的消息显示,此次活动门槛极低且覆盖面极广。用户只需将千问APP更新至最新版本,即可无门槛获得一张价值25元的奶茶免单卡。该免单券支持在包括喜茶、奈雪的茶、瑞幸咖啡及蜜雪冰城在内的全国30多万家线下门店使用。用户可以通过千问APP体验“一句话AI下单”,真正实现从语音指令到免单消费的无缝衔接。

除了基础福利,千问还推出了强社交属性的“邀新计划”。用户每成功邀请一位新朋友,双方均可额外获得一杯免单。根据活动规则,个人最高可累积获得21张免单卡,总价值达525元。以蜜雪冰城为例,这意味着单人最高可免费畅饮84杯柠檬水。

此外,针对春节期间的家庭社交场景,千问APP还设置了“千问AI生活卡”抽奖环节,总价值达万元。相关幸运名单将于2月7日至13日在官方微博每日公示。此次活动不仅是千问APP抢占春节流量高地的重要举措,更通过大规模的市场补贴,向大众普及了AI在日常消费场景中的便捷应用。

OpenAI 首席执行官 Sam Altman 正式宣布推出全新编程大模型GPT-5.3-Codex。作为 Codex 系列的最新迭代版本,该模型在技术指标与实际应用层面均实现了跨越式突破,标志着 AI 在辅助编程与计算机自动化操作领域进入了更成熟的阶段。

在性能表现上,GPT-5.3-Codex 刷新了多项权威评测纪录。其在 SWE-Bench Pro 编程评测中达到了57%,而在更侧重系统操作的 TerminalBench2.0和 OSWorld 评测中,分别取得了76% 和64% 的高分。这意味着该模型不仅能写代码,还具备了极为出色的计算机实操能力,能够像人类工程师一样理解并执行复杂的操作系统任务。

值得关注的是,新模型在运行效率上表现惊人。OpenAI 表示,在完成同等复杂度的任务时,GPT-5.3-Codex 的令牌(Token)消耗量较上一代5.2版本减少了超过一半,同时单令牌的处理速度提升了25% 以上。这种“高速度、低能耗”的特性,将显著降低企业和开发者集成 AI 编程能力的成本。此外,模型还支持在任务执行过程中进行实时调控与动态更新,极大增强了开发流程的灵活性。

安全性方面,GPT-5.3-Codex 是 OpenAI 首款在安全防护框架的网络安全维度获评“高等级”的模型。为了进一步构建防御体系,OpenAI 同步推出了可信访问框架试点计划,并投入1000万美元的 API 额度,旨在通过 AI 技术加速全球网络安全防御建设。

划重点:

  • 💻 编程与实操双进化:模型在 SWE-Bench Pro 等多项评测中创下新高,具备成熟的计算机系统自主操作与复杂编程能力。

  • 运行效率大幅跃升:相比5.2版本,同任务令牌消耗降低超50%,处理速度提升超25%,显著提升了任务执行的经济性。

  • 🛡️ 安全防御等级登顶:首获网络安全维度“高等级”评价,OpenAI 拨付千万美元额度专项助力网络安全体系建设。

2026年2月5日,OpenAI正式发布了全新的人工智能平台Frontier,旨在协助企业高效构建、部署并监督AI智能体。该平台的推出标志着OpenAI在企业级应用领域迈出了关键一步,力图将AI从简单的工具转变为能够与人类协作的“AI同事”。

OpenAI应用业务首席执行官菲吉·西莫(Fidji Simo)介绍,Frontier能够轻松整合各类数据源,使智能体具备处理复杂文件和运行代码的能力。 值得注意的是,该平台具有极强的开放性,不仅支持OpenAI自身的模型,还能兼容竞争对手如Anthropic微软开发的智能体。 西莫强调,Frontier并非要取代现有的软件工具,而是作为一个生态底座,让软件公司都能在其上部署自有智能体。

目前,Frontier已吸引了优步(Uber)财捷集团(Intuit)赛默飞世尔等首批企业客户进行测试。 业内分析认为,此举是OpenAI应对市场竞争的重要布局。近期,AI驱动的颠覆引发了软件股震荡,投资者担心传统工具被取代。 而OpenAI通过Frontier向外界传递了协作共赢的信号,试图通过标准化管理将更多企业纳入其AI生态系统。 此外,有消息称该实验室正筹备于今年第四季度公开上市,Frontier的表现或将成为其估值的关键支撑。



就在本周四,Meta官方证实了一个让硅谷震动的信息:他们正在为旗下的 AI 视频功能 Vibes 测试独立的 App。

如果说 2024 年是文生视频的“元年”,那么 2026 年就是巨头们贴身肉搏的“决战年”。Meta此举的目标非常明确——就是要把 Vibes 扶正,使其成为 OpenAI 旗下 Sora 的头号死对头。

那么,这个 Vibes 到底是个什么“物种”?

简单来说,你可以把它看作是一个全员“数字分身”的抖音。在 Vibes 里,用户不仅可以通过人工智能轻松创作并分享短视频,还能在专属的信息流(Feed)里刷到各种由 AI 生成的神奇内容。这种刷视频的体验虽然像极了抖音或者 Instagram 的 Reels,但本质区别在于:这上面的一切视频,全都是由 AI 一手包办的。

从“附属品”到“独立先锋”,Meta 显然等不及了。

其实Vibes早在去年 9 月就已经低调上线,但当时它还只是寄居在 Meta AI 应用里的一个子功能。这次Meta决定给它“独立编制”,显然是因为感受到了来自 OpenAI 的巨大压力。要知道,OpenAI 的 Sora 社交应用在Vibes发布后不久便强势杀入市场,抢走了不少风头。

Meta 的逻辑很简单:既然 AI 视频是未来,那就必须给它最顶级的入口。

依托于Meta强大的社交基因,Vibes 的优势在于它天然具备“病毒式传播”的土壤。当 Sora 还在死磕视频生成的真实感时,小扎已经开始考虑如何让你在 AI 视频里刷得停不下来了。这场“AI 版短视频战争”,胜负尚未可知,但用户的好戏才刚刚开始。



 西门子(Siemens)昨日正式宣布,已完成对法国半导体 AI 初创公司 Canopus AI 的收购。此次交易已于2026年1月12日秘密交割,旨在通过引入前沿的**计算量测(Computational Metrology)**技术,为其核心的 Calibre 晶圆制造软件平台注入强大的 AI 动力。

交易细节:深耕格勒诺布尔技术高地

虽然西门子官方未公开具体的财务条款,但据业界资深分析师估算,这笔交易金额约在 1.5亿至3亿欧元之间(约合12.3亿至24.6亿元人民币)。

  • 目标公司:Canopus AI,2021年成立于法国格勒诺布尔。

  • 核心优势:专注于利用机器学习和人工智能优化半导体量测与检测流程,尤其在解决边缘放置误差(EPE)方面拥有独特算法。

核心技术:“Metrospection”框架打破壁垒

Canopus AI 在业内率先提出了 “Metrospection” 理念。这一创新的软件框架利用 AI 技术打通了传统晶圆量测与检测之间的技术鸿沟:

  • 交互式审查:通过其特有的 Mapbox 类网页查看器,工程师可以交互式审查关键尺寸扫描电子显微镜(CD-SEM)图像及大批量制造(HVM)数据。

  • 模型优化:该技术能够精准量测边缘放置误差(EPE),从而大幅优化晶圆制造的物理仿真模型。

战略意图:剑指亚纳米级工艺控制

随着全球半导体步入2nm 及更先进制程,良率控制已成为晶圆厂的“生死线”。西门子计划将 Canopus AI 的技术与 Calibre 现有的“计算光刻”能力深度整合:

  • 端到端方案:提供从设计到制造物理仿真的闭环 EDA 解决方案。

  • 良率加速:通过精准的亚纳米级工艺控制,帮助制造商缩短量产周期,并显著加速良率爬升(Yield Ramp)。

西门子数字化工业软件总裁 Tony Hemmelgarn 表示,此次收购体现了西门子将工业 AI 应用于解决制造挑战的决心,进一步巩固了其在先进制程 EDA 领域的领先地位。

美国AI初创巨头Anthropic近日推出了一款专门面向企业法务团队的AI生产力工具,这一举动直接导致全球法律软件及信息服务行业的股价出现剧烈波动。市场分析认为,该工具的问世意味着AI对传统媒体和信息服务商业模式的威胁已进入实质性阶段。

受此消息影响,欧美市场相关板块遭遇重挫。法律出版巨头RELX美股一度大跌约14%,旗下的法律及商业资讯服务面临直接冲击;与此同时,荷兰出版商沃尔特斯·库鲁维尔(Wolters Kluwer)欧股跌幅也超过11%。市场的恐慌情绪并未止步于法律行业,由于担忧AI将重塑整个数据分析领域,征信巨头益博睿(Experian)、金融数据服务商伦敦证券交易所集团(LSEG)以及汤森路透等行业标杆的股价均出现了8%至11%不等的跌幅。

据Anthropic介绍,该款新工具旨在实现法律工作的自动化处理。其核心功能涵盖了繁杂的合同审查、保密协议(NDA)的分类与处理、法律简报的撰写,以及针对常见咨询的模板化回复。尽管Anthropic特别强调该插件不提供最终法律建议,仍需持牌律师审核,但其高效的自动化能力依然让投资者对传统软件服务商的前景感到担忧。

此次市场震荡并非孤例。就在上周,由于德国软件巨头SAP发布疲弱指引,以及谷歌DeepMind推出的AI工具Project Genie引发游戏行业担忧,相关板块已持续承压。金融机构分析人士指出,当前市场对于AI不确定性的反应呈现出一种“先抛售、后询问”的防御性姿态,整个软件板块的情绪正处于高度敏感期。

划重点:

  • ⚖️ Anthropic推出企业级法务AI工具,可自动化处理合同审查、NDA分类及法律简报撰写等核心任务。

  • 📉 欧美数据服务类股票遭遇抛售潮,RELX、汤森路透及沃尔特斯·库鲁维尔等行业巨头股价跌幅均超10%。

  • ⚠️ 市场担忧AI技术正加速颠覆媒体、法律及金融信息行业的传统商业模式,投资者情绪转为高度警惕。


为深度推进实数融合,重庆市经济和信息化委员会与重庆市财政局于近日联合印发了《重庆市促进实数融合推动“人工智能+制造”若干政策》。该政策通过20条精准扶持措施,构建起覆盖技术研发、数据建设、案例推广等多个维度的全方位激励体系,单项奖补金额最高可达500万元。

核心亮点:重金激励工业垂直领域创新

本次政策的核心目标在于鼓励企业深耕工业场景,通过 AI 技术实现制造业的跨代升级:

垂类模型研发:对面向工业领域研发垂类大模型、智能体的企业,给予最高200万元奖励。

数据集与数据空间:鼓励打造高质量工业数据集、构建可信数据空间,符合条件的企业及机构最高可获300万元奖励。

典型案例表彰:对入选工信部人工智能典型案例的企业,额外给予50万元奖励。

创新载体建设:支持建设相关创新载体,奖补金额达200万元。

政策解读:从“单点应用”转向“全量智能”

与以往的通用型支持不同,重庆此次新政展现了极强的行业针对性。通过重奖“垂类大模型”和“高质量数据集”,重庆正试图解决工业 AI 落地中“数据不通”和“模型不精”的痛点,引导 AI 技术从实验室走向车间,实现真正的实数融合。

小编认为,这一政策的发布将极大激发重庆本地工业企业及 AI 技术服务商的创新活力,助力重庆加速打造具有国际竞争力的“智能造”高地。

AI圈上演了一场激烈的正面交锋。OpenAI 首席执行官萨姆·奥尔特曼在 X 平台公开发文,严厉指责竞争对手 Anthropic 在超级碗期间投放的广告存在“明显的不实信息”,并揭露其长期以来惯用“含糊其辞的双面话术”。

这场口水战的导火索是 Anthropic 发布的最新宣传片。虽然广告中并未直接点名 OpenAI 或 ChatGPT,但其宣称“Claude 回复不受广告商影响、无第三方植入”的说法,被外界普遍解读为是对 OpenAI 近期测试广告模式的冷嘲热讽。对此,奥尔特曼强硬回应称,OpenAI 绝对不会以对方描述的那种“愚蠢方式”投放广告,并强调广告完全独立于回答内容,绝不影响 AI 的客观性。

除了反击广告内容,奥尔特曼还从市场体量和商业模式上对 Anthropic 进行了全方位“降维打击”。他透露,仅得克萨斯州免费使用 ChatGPT 的用户数就已超过全美 Claude 的总用户数,暗示双方根本不在一个量级。他抨击 Anthropic 定价昂贵且奉行“威权主义”,妄图管控用户并插手他人的商业模式,而 OpenAI 则致力于让数十亿普通民众都能免费获取 AI 技术。

值得注意的是,OpenAI 也在超级碗期间展示了聚焦创作者的广告,并宣布其编程辅助工具 Codex 自周一上线以来应用下载量已突破50万次。奥尔特曼此番表态,不仅是为了澄清广告争议,更是试图在价值观高地上将 OpenAI 塑造成“民主化 AI”的代表。

划重点:

  • 🚫 奥尔特曼怒斥广告造谣:直指 Anthropic 的超级碗宣传存在虚假内容,反驳了关于广告会影响 ChatGPT 回复质量的指控。

  • 📊 用户规模对比悬殊:奥尔特曼称单是一个德州的使用人数就远超对方全美总量,嘲讽 Anthropic 只是服务高消费人群的小众产品。

  • ⚔️ 企业价值观之争:OpenAI 抨击 Anthropic 试图管控用户和制定霸王规则,重申其坚持提供免费 AI 服务以实现技术普惠的使命。

 在刚刚发布的2025年第四季度财报中,Alphabet(谷歌母公司)交出了一份令市场振奋的答卷:旗下 AI 聊天机器人 Gemini 的月活跃用户(MAU)已正式突破7.5亿大关。这一显著增长不仅标志着 Gemini3模型在消费者端的成功普及,也助力 Alphabet 全年营收历史上首次突破 4000亿美元 门槛。


增长引擎:Gemini3的深度变革

谷歌 CEO 桑达尔·皮查伊在财报电话会议上强调,Gemini3的发布是公司本季度的核心转折点。作为谷歌迄今最先进的型号,Gemini3在推理深度与多模态交互上的显著提升,直接拉动了用户参与度:

  • 用户跨越式增长:月活从上季度的6.5亿猛增至7.5亿,稳居 AI 行业第一梯队。

  • 规模化效率:皮查伊透露,Gemini API 目前每分钟处理超过 100亿个代币(Tokens),且通过模型优化,其单位服务成本在2025年内大幅下降了 78%

市场排位:直追 ChatGPT,领先 Meta AI

尽管 Gemini 增势强劲,但竞争格局依然胶着。目前的全球 AI 月活梯队呈现出三足鼎立之势:

  1. ChatGPT:依然占据榜首,预计2025年底月活将达到 8.1亿

  2. Gemini:以 7.5亿 紧随其后,差距正在迅速缩小。

  3. Meta AI:以接近 5亿 的月活位列第三。

为了进一步渗透市场,谷歌近期推出了每月 7.99美元Google AI Plus 套餐。虽然其财务贡献尚未在第四季度体现,但分析人士认为,这种更亲民的定价策略将成为2026年吸引预算敏感型用户的利器。

硬件突围:Ironwood TPU 硬刚英伟达

除了应用端,谷歌在 AI 基础设施层面的布局同样激进。财报披露,谷歌最新一代 TPU 加速芯片 Ironwood(TPU v7) 正式发布。

  • 性能对标:Ironwood 的 FP8性能达到 4.6petaFLOPS,与英伟达的 B200旗鼓相当。

  • 规模优势:Ironwood 支持在单个超级集群(Superpod)中集成超过 9216个 TPU,旨在通过垂直整合的软硬件生态降低 AI 计算成本,直接向英伟达的算力统治地位发起挑战。

首席商务官菲利普·辛德勒总结道,无论是免费层级的用户扩张还是 Gemini Enterprise 的订阅增长,AI 正在全方位驱动业务提速。Alphabet 已宣布2026年资本支出指引将高达 1750亿至1850亿美元,以确保其在 AI 军备竞赛中保持领跑。