分类 AI快讯 下的文章

全球知名设计资源平台Freepik近日正式上线字节跳动Seedream4.0图像生成模型,这一升级将AI生图能力无缝集成到其创意工具中,为设计师和创作者带来革命性体验。 作为豆包大模型家族的最新成员,Seedream4.0支持多模态输入输出,生成质量和速度均达业界领先水平。更吸引人的是,Freepik的Premium+会员可享无限生成次数,这一福利被誉为“太香了”,预计将进一步巩固平台在AI设计领域的领先地位。

模型升级:多模态生图一站式解决

Seedream4.0是字节跳动Seed团队于9月9日发布的图像创作模型,标志着从单一文生图向生成与编辑一体化的跃进。 相较前代,该模型首次支持文生图、图像编辑和组图生成,用户可通过文本描述或上传多张图片进行融合创作。例如,输入“将两张角色照片合影,参考指定姿势”,模型能精确保留人物特征,避免传统AI常见的“形象漂移”问题,输出连贯的故事化图像。

6389310077807769518097684.jpg

在Freepik平台上,这一功能直接嵌入AI图像生成工具,用户无需切换应用,即可实现高清输出。模型支持2K和4K分辨率、任意宽高比,以及最多6张图像参考,适用于海报设计、插画创作和社会媒体内容生成。 专业评测显示,其在视觉美感、指令跟随和生成速度上超越多项竞品,生成一张1K图像仅需数秒。

无限使用福利:Premium+会员专属狂欢

Freepik此次升级的最大亮点在于会员权益优化:Premium+和Pro用户可无限生成图像,无需担心配额限制。 这意味着设计师能自由探索复杂场景,如基于抽象符号编辑图像(例如用箭头指示让角色“变胖”)或创建连环画式组图,实现从灵感到落地的全流程创作。 对于企业用户而言,这一功能将大幅降低设计成本,提升效率,尤其在商业海报和营销素材制作中表现出色。

此外,模型具备深度意图理解能力,能处理物理规律、三维空间和逻辑推理任务,如续写漫画或解谜式编辑,确保输出细节丰富、风格统一。 Freepik强调,用户上传文件后,AI将根据需求自动分析并生成专业模板,极大简化工作流程。

行业影响:AI设计生态加速融合

Seedream4.0的上线不仅提升了Freepik的竞争力,还体现了AI与设计平台的深度融合趋势。 字节跳动表示,该模型已在豆包App免费开放体验,而Freepik的集成将进一步扩展其全球影响力。未来,团队计划探索更实时的交互式生成,推动多模态创意引擎的成熟。

据最新消息,AI公司Anthropic近日为其Claude AI助手推出了文档生成和编辑功能升级,用户现在可以在聊天界面中直接创建和编辑Excel表格、PowerPoint演示文稿、Word文档以及PDF文件。该功能目前作为预览版向付费订阅用户开放,标志着AI工具在办公应用领域的进一步扩展。

新功能允许用户通过自然语言描述或文件上传的方式,让Claude生成相应的办公文档。用户可以上传销售数据文档,然后要求Claude分析数据并生成包含图表和分析洞察的报告。系统还支持创建预设公式的财务模型或项目跟踪表格等专业模板。

在文档格式转换方面,Claude支持跨格式处理,例如将PDF报告转换为PowerPoint幻灯片,或将发票数据整理为Excel统计表格。这些操作通过对话方式完成,无需用户具备专业的办公软件技能。

6389310014213854817178774.png

技术实现方面,Claude通过在私有计算环境中编写和执行代码来生成文档。这种技术架构确保了生成的Excel文件具备正确的公式设置和多工作表结构,用户可以直接下载或保存到Google Drive中使用。

目前,该预览功能仅对Claude的Max、Team和Enterprise订阅用户开放,Pro用户预计在几周内可以使用。用户需要在设置菜单中启用"升级文件创建与分析"选项才能访问这些功能。

Anthropic在功能说明中提醒用户注意数据安全,因为该功能需要互联网访问来处理文件。公司建议用户在使用过程中密切关注操作过程,确保敏感信息的安全性。

从产品策略来看,这一功能升级将Claude从对话式AI助手扩展为实用的办公工具,直接与Microsoft Office套件和Google Workspace等传统办公软件形成竞争。通过集成文档创建功能,Claude试图在企业级AI应用市场中占据更重要的位置。

业内分析认为,AI工具向办公应用领域的扩展反映了人工智能技术在实际业务场景中应用深度的提升。随着AI模型能力的增强,这类工具有望在文档处理、数据分析等日常办公任务中发挥更大作用。

不过,这种功能扩展也带来了一些考量。用户需要评估在AI工具中处理敏感商业数据的安全性,特别是在涉及财务报告或机密信息的场景中。此外,AI生成的文档质量和准确性仍需要人工审核和验证。

从竞争格局来看,Claude的这一功能更新使其在与ChatGPT等竞争对手的比较中增加了差异化优势。随着各家AI公司都在扩展产品功能边界,办公应用可能成为AI助手竞争的重要战场。

目前尚未公布该功能向所有用户开放的具体时间表。随着功能的逐步完善和用户反馈的收集,预计Anthropic将进一步优化文档生成的准确性和易用性。

AI 助手 Claude 迎来全新功能升级,现在用户不仅能收到文字回复,还能直接生成和编辑 Excel 表格、Word 文档、PPT 幻灯片和 PDF 文件。这一功能已经在 Claude.ai 官网和桌面应用上线。
4.png

目前,该功能面向 Max、Team 和 Enterprise 版本用户提供预览体验,Pro 用户将在未来几周内陆续获得使用权限。

Claude 能够根据用户指令生成实际文件,无论是从零开始,还是基于上传的数据进行加工整理,都能快速产出高质量成果:

数据洞察:输入原始数据,Claude 会返回清洗后的数据、统计分析、图表和文字解读。

智能表格:可以自动生成包含公式和多表格的财务模型、项目追踪表或预算模板。

跨格式转换:上传 PDF 报告,Claude 能自动生成 PPT;输入会议笔记,可以变成排版好的文档;发票也能转化为带有计算的表格。

这一升级背后的核心,是 Claude 拥有了一个“私人电脑环境”。在这里,它可以编写代码并运行程序,帮助用户完成从数据处理到文件生成的整个流程。换句话说,Claude 不再只是一个回答问题的助手,而是能真正参与到项目执行中的“数字合作者”。

想要体验的用户,可以通过以下步骤开启:

在设置中打开“升级版文件创建与分析”实验功能;

上传文件或直接描述需求;

在对话中一步步引导 Claude 完成任务;

下载结果文件,或直接保存到 Google Drive。

官方提醒:该功能会为 Claude 提供联网环境,请用户注意数据安全。

划重点:

📊 Claude 可直接生成和编辑 Excel、Word、PPT、PDF 文件,实现从想法到成果的快速转化。

⚡ 功能已向 Max、Team、Enterprise 用户开放预览,Pro 用户将陆续获得权限。

🤝 Claude 不只是助手,更像“项目合作者”,能在专属电脑环境中执行代码和文件处理。

甲骨文公司(Oracle)日前公布了其云基础设施部门未来人工智能业务的订单量大幅增长,这一消息推动该公司股票在盘后交易中上涨了27%,创下历史新高。该公司报告称,未完成的业绩承诺 —— 即已签订但尚未实现的收入 —— 激增至4550亿美元,远高于三个月前的1380亿美元。

图源备注:图片由AI生成,图片授权服务商Midjourney

甲骨文的首席执行官萨夫拉・卡茨(Safra Catz)形容这是一个 “惊人的季度”,并表示公司在最新的三个月内与三家不同客户签署了四份数十亿美元的合同。华尔街对此次订单的增长早有预期,特别是在今年7月甲骨文签署了一份价值300亿美元的年度合同之后,但并没有预料到订单量会有如此大幅的提升。

尽管甲骨文在云计算服务领域起步较晚,但随着人工智能初创公司及其他大型科技集团对数据中心基础设施需求的激增,甲骨文逐渐获得了市场的认可。今年早些时候,甲骨文还与 OpenAI 和软银签署了5000亿美元的 “星门计划” 合作协议。

该公司股票在盘后交易中的上涨为其市值增加了约1700亿美元,同时也让创始人拉里・埃里森(Larry Ellison)的个人财富增加了约700亿美元,使其稳居全球第二富翁,仅次于埃隆・马斯克(Elon Musk)。自年初以来,甲骨文的股价已上涨了43%。

在与投资者的电话会议中,卡茨表示,甲骨文与众多人工智能领域的领军企业签署了重要的云合同,包括 OpenAI、xAI、Meta、Nvidia、AMD 等。她预测,公司的基础设施业务收入将在未来五年内从今年的180亿美元飙升至1440亿美元,预计这一数据将比华尔街的预期高出近60%。

与之相比,亚马逊云服务(Amazon Web Services)在上一财年的收入已超过1070亿美元。这一增长也引发了华尔街分析师的疑问,他们担心甲骨文如何能够快速增加计算能力,以满足新需求,而目前大多数云公司都面临芯片短缺的困扰。

甲骨文预计,在其到明年5月底的财政年度内,其资本支出将增加100亿美元,达到350亿美元。卡茨声称,甲骨文能够在相对较少的资本支出下实现更高的收入,因为其并不投资于建筑物,并且更加高效地使用计算设备。埃里森补充说,未来的需求反映了在训练 AI 模型后,进行推理所需的计算能力短缺。

甲骨文在最新季度报告中显示,收入增长12%,达149亿美元,略低于华尔街预期的150亿美元。而调整后的净收入则同比增长8%,达43亿美元,超过分析师预期。

划重点:

💼 甲骨文未来人工智能业务订单激增,未完成业绩承诺达到4550亿美元。

📈 股票在盘后交易中上涨27%,市值增加约1700亿美元。

🤝 公司与多家 AI 巨头签署重要合同,预计未来基础设施业务收入将大幅增长。

在数字人领域,清华深研院与国际数字经济研究院的中国团队近日推出了名为 GUAVA 的新技术,标志着数字人制作进入了一个全新的时代。通过仅一张照片,GUAVA 能够在0.1秒内生成一个高质量的3D 高斯化身,并实时驱动,画面流畅度超过50帧每秒。

2.png

传统上,创建高质量的3D 数字人需要复杂的多视角拍摄,或者耗时耗力的视频数据训练,往往需要几个小时才能完成。而 GUAVA 的出现,无疑是对这一过程的颠覆。与其他方法相比,GUAVA 的重建速度可谓惊人,所需时间仅为0.1秒,而其他算法如 ExAvatar 需要2.4小时,GaussianAvatar 需1.3小时,甚至 GART 也需7分钟。这样的速度让人们惊叹不已。

GUAVA 的优越表现得益于其创新的技术架构,主要包含两个关键组件:EHM 模型和3D 高斯泼溅。EHM 模型通过结合 SMPLX 和 FLAME 技术,确保了人脸表情的高保真度和精准控制,而3D 高斯泼溅则通过将场景拆分为数百万个3D 高斯球体,从而实现快速渲染。这种方法使得 GUAVA 在身份一致性上也表现出色,相关指标超过了竞争对手的水平。
3.png

在实际应用方面,GUAVA 能够为自媒体、直播、电子商务和教育等多个领域提供强大的支持。自媒体用户可以通过一张图片迅速创建可定制的角色,极大缩短了制作周期;直播主播可以轻松上传自拍,快速转换为虚拟形象;电商平台则可以实现千人千面的虚拟模特;教育行业也可利用虚拟教师进行沉浸式教学。这些应用场景展示了 GUAVA 技术的广泛潜力。

清华深研院与 IDEA 研究院在没有依赖于融资和概念炒作的情况下,通过实际成果展现了他们在数字人技术领域的领导地位。他们的研究不仅在 ICCV2025大会上获得认可,更是通过开源代码的方式让全球的同行得以共享这一创新成果。

参考资料:

https://github.com/Pixel-Talk/GUAVA

https://eastbeanzhang.github.io/GUAVA/

近日,硅谷公司 Fellou 推出了一款名为 Fellou CE(概念版)的 AI 浏览器,标志着数字工作方式的一次重大转型。该浏览器并不仅仅是一个信息获取工具,而是一个可以执行复杂任务的智能助手,旨在提升用户的工作效率和创造力。

Fellou 的创始人兼 CEO Dominic Xie 指出,现今科技界普遍关注 AI 节省时间的能力,但他认为这种思维是有误的。他表示,AI 的真正价值在于它能作为 “认知杠杆”,帮助人们更好地思考、创造和解决复杂问题。
1.png

Fellou 的设计理念是希望用户从繁重的手动操作中解放出来,将工作流程自动化,转而专注于更高层次的创造性思维。比如,用户只需告诉 Fellou:“请分析我的 LinkedIn 个人资料,并找出10个适合我的产品负责人职位,然后用我桌面上的定制简历申请。”Fellou 会自动完成这一过程,包括浏览多个网站、分析职位要求,并将用户的简历发送出去。用户在此过程中仍可保持对每一步操作的实时控制。

Fellou 的创新在于其 “无缝体验连续体” 的构建,涵盖三个主要方面:交互连续体、任务连续体和记忆连续体。通过自然对话的方式,Fellou 能够理解用户的意图并主动提供帮助,而不是单纯等待用户的指令。此外,Fellou 通过整合不同应用的记忆,帮助用户建立一个完整的数字思维导图,以便更好地进行决策。

image.png

在与 Fellou CE 的交互中,用户会发现任务处理变得更加连贯。Fellou CE 打破了传统浏览器的割裂体验,让人机交互更加自然。用户只需用自然语言下达指令,Fellou CE 便会理解并执行,无需繁琐的手动操作。同时,它还具备记忆功能,能够根据用户的历史操作和偏好,智能优化信息推荐,让每次使用都更为高效。

更值得一提的是,Fellou CE 的 Deep Search 和 Visual Report 功能现已免费开放,用户可以精准获取所需信息,并将零散的数据转化为可视化的报告,极大节省了时间和精力。此外,Fellou CE 在信息安全方面也表现优异,用户的隐私和数据得到了有效保护。

随着市场需求的变化,Fellou 的推出为 AI 的应用打开了新的方向。不同于第一波 AI 技术的聊天机器人,Fellou 致力于提供能够执行实际任务的智能代理。Xie 表示,当前的 AI 发展阶段是从 “聊天” 向 “执行” 的过渡,Fellou 正是这一转变的先锋。公司已经积累了超过一百万用户,显示出市场对能够消除繁琐工作的工具的强烈需求。

通过 Fellou CE,用户不仅能提升工作效率,还能享受无缝的数字体验。这款浏览器正在重新定义人机协作的方式,让每个人都能拥有超越传统的创造力与执行力。

官网:https://fellou.ai/

近日,由著名加密货币大亨文克莱沃斯兄弟创办的加密交易所 Gemini 宣布,计划大幅提高其美国首次公开募股(IPO)的拟议价格区间。这一举动不仅反映了投资者对加密行业日益增长的兴趣,也显示出 Gemini 在市场中的信心。

根据最新的消息,Gemini 现计划通过出售 1667 万股股票,筹集约 4.333 亿美元。新的每股价格范围设定在 24 美元至 26 美元之间,相比于之前的 17 美元至 19 美元的价格区间,有了显著提升。此次调整使得 Gemini 的上市估值目标高达 30.8 亿美元,充分展示了市场对加密企业的期待和热情。

市场分析人士表示,此次价格的上调可能与近期加密市场的复苏有关。随着比特币等主流加密货币的价格回升,投资者信心也随之增强。此外,越来越多的传统金融机构开始关注和进入加密行业,使得整个市场的热度持续上升。Gemini 作为行业内的重要玩家,此时选择 IPO,无疑是希望能够抓住这一良机,获取更多的资金和资源,以推动公司的进一步发展。

与此同时,Gemini 的 IPO 也被视为加密交易所发展的一个重要里程碑。它不仅将为公司带来资金支持,还将提升其品牌影响力和市场地位。随着投资者对加密企业的兴趣日益高涨,未来可能会有更多的加密公司跟随 Gemini 的步伐,迈向公开市场。

Gemini 的 IPO 将成为加密行业的一次重要事件,未来的发展动态值得持续关注。

OpenAI最近搞了两个重磅更新:一是遇到敏感话题就自动把对话甩给更高级的GPT-5处理,二是终于想起来要加家长控制功能了!

现在只要用户聊到自残、暴力这些危险内容,系统就会立马把对话转给GPT-5——这个号称安全系数更高的模型会尝试温和干预,比如主动提供心理健康资源或者建议联系专业人士。不过官方也坦承:AI毕竟不是真心理医生,紧急情况还是得打求助热线。

更让家长开心的是,新推出的家庭监护功能能让爸妈们设定使用时间限制、屏蔽不当内容,还能收到孩子使用情况的周报。OpenAI产品经理说了句大实话:"我们知道孩子们早就绕过年龄限制在用ChatGPT了,不如直接给家长管理工具。"

这些更新来得正是时候——上个月刚爆出有青少年通过ChatGPT获取自杀方法的消息,搞得OpenAI相当被动。目前新功能正在美国试点,预计明年推广到全球。

(要我说啊,AI公司现在越来越像操心的老母亲了:既要防着用户乱说话,还得盯着小朋友健康上网。不过这套"AI保姆"系统真能管住人类折腾的心吗?咱们还是走着瞧吧!)

OpenAI搞了个大动作:要用AI招聘平台正面刚领英

这家AI巨头刚宣布推出全新AI招聘平台,准备和职场老大哥领英掰手腕。

这个新平台直接把AI深度整合到招聘全流程:不仅能帮企业自动筛选海量简历,还能用聊天机器人进行首轮面试,甚至能分析候选人的微表情和语音语调——听起来像是HR的梦幻工具,但也让人有点毛骨悚然。

OpenAICEO奥特曼亲自站台说:"现在的招聘过程效率太低,我们要用AI让人才和企业真正精准匹配。"据内部测试数据显示,这个系统能把招聘周期从平均42天缩短到9天,但具体怎么实现的?嘿嘿,商业机密。

目前已经有大厂买单了:亚马逊、微软(咦?这不是OpenAI的投资方吗)和高盛都在试点使用。不过劳工组织马上跳出来警告,说AI招聘可能带来算法歧视,要求监管部门介入。

领英这边倒是很淡定,发言人笑着回应:"我们20年积累的5亿职场社交数据,可不是几个AI模型就能超越的。"不过暗地里据说已经在加快开发同类功能了。

(要我说啊,以后找工作可能真要变成和AI斗智斗勇了——简历得按机器喜好写,面试要学着讨好算法,说不定还得报个"如何通过AI面试"培训班呢!)


尽管面临市场动荡,专注AI代码生成的初创公司Cognition AI近日成功完成4亿美元新一轮融资,估值达102亿美元。本轮融资由Founders Fund领投,其创始人Peter Thiel首次参与AI领域投资。

这家以开发「Devin」AI程序员闻名的公司,目前仅通过14人团队就实现年化收入1.2亿美元。其核心产品能自动完成全栈开发任务,最新演示显示已可独立部署完整网络应用。

值得关注的是,本轮融资协议包含特殊条款:投资者同意将80%资金长期锁定于国债投资,公司仅可动用利息部分运营。这种创新资本结构旨在应对当前高风险投资环境。

与此同时,行业正面临洗牌:竞争对手Magic、Adept等先后裁员或转型,而Cognition的工程师时薪定价35美元仍供不应求。分析师认为,这反映市场正在向具备实际营收能力的AI企业集中。

(当其他AI初创公司还在烧钱时,Cognition用14人创造1.2亿年收入的现实,或许揭示了AI落地的新范式:不是拼参数规模,而是看实际产出价值。)



这位OpenAI的老板在TechCrunch大会上吐槽,说AI生成的内容本身没问题,但平台得明确告诉用户哪些是机器人账号。他自曝OpenAI正在搞个黑科技——能用99.9%的准确率识别AI生成内容,还打算免费开放给各大社交平台用。

不过奥特曼话锋一转又帮AI说起好话:"要是所有AI生成的内容都标得明明白白,大家反而能玩得更开心"。他建议平台干脆把人和机器人的账号分开,让用户自己选要不要和机器人耍。

现在各家平台反应笑死人了:Meta急着说要强制标注AI内容,X搞了个"真人认证"小徽章,TikTok还在装死让用户自己申报。要我说啊,眼看美国大选要来了,这些平台再不整治AI内容,怕是要出大事。

(连奥特曼这种AI大佬都开始喊"机器人太多",看来社交媒体真要变天——要么好好做个人类交友平台,要么就等着被假账号淹没吧!)


法国人工智能公司Mistral AI正成为OpenAI最引人注目的竞争对手之一。这家成立于2023年的初创公司凭借其开源模型和企业级解决方案,在短短两年内估值飙升至60亿美元,并与微软、IBM等科技巨头达成战略合作。

核心优势

  1. 开源战略:Mistral 7B、Mixtral 8x7B等模型均开放权重,允许开发者自由使用和修改,与OpenAI的闭源模式形成鲜明对比

  2. 轻量化技术:专注高效能小参数模型(如7B参数的Mistral 7B性能堪比70B参数模型),降低部署成本

  3. 多模态布局:最新推出的Mistral Next支持文本、图像及音频处理,预计2025年推出视频功能

商业模式

  • 免费开源模型扩大开发者生态

  • 企业级付费服务(起价0.25欧元/百万token)

  • 与云厂商合作的分成模式(已入驻AWS、Azure、Google Cloud)

争议与挑战
尽管获得法国政府支持,但公司因接受美国资本投资(a16z持股15%)被欧盟质疑数据主权问题。此外,其代码库中出现的“AI武器化”相关内容曾引发伦理争议。

目前Mistral AI已吸引赛诺菲、雷诺等欧洲企业客户,其能否在OpenAI和谷歌主导的市场中突围,将成为观察欧洲AI竞争力的重要风向标。

(通过技术开源+企业服务双轮驱动,Mistral AI正在重塑AI行业的竞争格局——这场开源与闭源之路的较量,可能决定未来智能技术的民主化进程。)


就在Spotify推出AI电台功能后,亚马逊音乐正在加速布局AI功能以应对竞争。该公司最新推出的"每周心情"(Weekly Vibe)功能已于本周向美国全层级订阅用户开放,支持iOS和Android客户端。 这项功能旨在解决音乐发烧友的核心痛点——长期聆听相同歌单产生的审美疲劳。每周一,系统会基于AI算法分析用户近期收听习惯,结合不断变化的"音乐情绪"偏好,自动生成个性化播放列表。与传统推荐不同,"每周心情"特别注重推荐相似风格的新作品,强化音乐发现体验。 用户可在应用底部"媒体库"进入"为你打造"专区查看每周更新的歌单。每个列表都包含AI生成的主题标题和描述,并围绕特定风格(如嘻哈或流行金曲)进行曲目编排。用户还可分享歌单至社交平台或保存至个人收藏。 此次更新是亚马逊音乐去年推出的"Maestro"AI歌单生成器的功能延伸。Maestro允许用户通过输入情绪关键词甚至随机表情符号来创建个性化播放列表。而最新推出的"探索"功能则能深度解析用户喜爱歌手的热门单曲,并推荐相似风格音乐人。

据TechCrunch独家获悉,OpenAI正在重组其颇具影响力的"模型行为"团队(Model Behavior Team)。这个约14名研究人员组成的精干小组,专门负责塑造AI与人类的交互方式。根据研究总监马克·陈(Mark Chen)8月的内部备忘录,该团队将并入规模更大的"后期训练"团队(Post Training Team),直接向负责人马克斯·施瓦泽(Max Schwarzer)汇报。

此次重组伴随着人事变动:团队创始领导人张乔安妮(Joanne Jang)将转岗组建名为"OAI实验室"的新研究团队。她在接受TechCrunch采访时透露,新团队将专注于"发明和原型化人机协作的新交互界面"。这位在OpenAI任职近四年的资深研究员表示:"我期待探索超越聊天范式的交互模式,将AI系统打造为思考、创造、学习与连接的工具。"

模型行为团队一直是OpenAI的关键研究力量,其职责包括:

  • 塑造AI模型的人格特质

  • 减少谄媚性回应(即盲目附和用户甚至不健康观点)

  • 处理政治偏见问题

  • 界定公司对AI意识的官方立场

重组决定意味着,AI的"人格特质"正式被提升为核心技术开发要素。这一调整恰逢OpenAI面临模型行为争议之际:今年用户对GPT-5的人格改动强烈不满,认为其虽然减少了无原则附和,但显得过于冷漠。公司不得不恢复GPT-4o等旧版模型的访问,并通过更新让GPT-5的回应显得"更温暖友好"。

更严峻的挑战来自法律层面:8月一对父母起诉OpenAI,指控GPT-4o未能对其16岁儿子的自杀倾向进行干预,最终导致悲剧发生。这起案件凸显出AI开发者必须在"友好性"与"原则性"之间找到精妙平衡。

张乔安妮领导下的模型行为团队曾参与GPT-4之后所有模型的开发,包括GPT-4o、GPT-4.5和GPT-5。她此前还参与过Dall-E 2等图像生成工具的研发。对于新成立的OAI实验室是否会同前苹果设计总监乔尼·艾维(Jony Ive)领导的硬件项目合作,她表示持开放态度,但初期将优先探索自己更熟悉的研究领域。


一场由作家群体对人工智能公司Anthropic发起的集体诉讼以15亿美元(约合人民币109亿元)的历史性和解告终,约50万名作者将有资格获得至少3000美元(约合2.2万元人民币)的赔偿。这虽是美国版权法史上最大规模的和解案,却并非作家的胜利——而是科技公司的又一次成功突围。

科技巨头正竞相囤积海量文本材料来训练其大语言模型(LLM),这些模型驱动着ChatGPT和Claude等突破性AI聊天产品。尽管这些AI生成的内容平淡无奇,却正在危及创意产业的生存。AI需要吞噬更多数据才能变得更精密,但在几乎爬取完整个互联网后,科技公司确实面临着新信息枯竭的困境。

这正是Anthropic从"影子图书馆"盗版数百万本书籍投喂AI的原因。本次巴茨诉Anthropic案,只是针对Meta、谷歌、OpenAI和Midjourney等公司的数十起诉讼之一,争议焦点均在于使用受版权保护作品训练AI的合法性。

作家们获得赔偿并非因为作品被AI使用——这只是对刚融资130亿美元的Anthropic象征性惩戒,罚金针对的是其非法下载书籍而非购买的行为。

今年6月,联邦法官威廉·阿尔苏普裁定:使用版权材料训练AI确实合法。这位法官认为这种使用方式具有"转化性",应受合理使用原则保护——这项自1976年未曾更新的版权法例外条款,正成为科技公司的法律护身符。

"如同任何渴望成为作家的阅读者,Anthropic的大语言模型通过作品学习不是为了复制或取代它们,而是为了开辟新道路创造不同内容。"法官在判决书中写道。

真正促使案件进入审理阶段的是盗版行为而非AI训练本身。随着和解达成,庭审已不再必要。

"若获得法院批准,今日的和解将解决原告提出的历史遗留诉求,"Anthropic副总法律顾问阿帕纳·斯里达尔在声明中表示,"我们始终致力于开发安全AI系统,助力人类和组织扩展能力、推动科学发现并解决复杂问题。"

随着更多关于AI与版权作品关系的案件进入司法程序,巴茨诉Anthropic案将成为重要判例。但这些裁决产生的连锁反应,或许会促使其他法官作出截然不同的判决。

【事件深层次解读】

  1. 科技公司通过"合理使用"漏洞系统性地将创意作品转化为训练数据,却仅因盗版行为受到象征性处罚

  2. 每位作家3000美元的赔偿金额,与AI模型利用其作品产生的商业价值完全不成比例

  3. 1976年制定的合理使用原则在AI时代已显滞后,法律体系亟待更新

  4. 和解协议规避了核心法律争议,为科技公司继续无偿使用版权内容留下空间