一直以来,苹果的神经引擎(ANE)都被严密地封锁在“仅限推理”的铁幕之后。但在2026年的今天,这道围墙被推倒了。近日,工程师 Manjeet Singh 联手Claude AI,成功通过逆向工程破解了M4芯片ANE 的算力机密,向世界证明:你的 Mac mini 不止能“养龙虾”,它甚至能直接用来训练 Transformer 模型!

这次突破的核心在于绕过了臃肿的CoreML框架。Manjeet Singh 在Claude的辅助下,深入 MIL 语言与 E5二进制的迷雾,成功实现了对ANE硬件的直接操控。实验数据令人震惊:在 M4芯片上运行单层 Transformer,其峰值能效比竟然高达6.6TFLOPS/W,这一数据是专业级显卡 A100的80倍,更是 H100的50倍以上。

长期以来,业界普遍认为 NPU 无法胜任训练任务,是因为硬件不给力。但这次“暴力破解”撕开了真相:硬件从来不是瓶颈,苹果的软件限制才是。现在,开发者已经能够在Mac mini上实现 Stories110M 模型的完整训练,且整机功耗竟然低至不到1瓦特。

这意味着,AI 革命的门槛正在发生剧变。过去动辄数万美元的算力账单,在M4芯片的极限能效面前显得像个笑话。对于独立开发者和家庭实验室来说,昂贵的 GPU 集群不再是唯一选择,你桌面上的那台小巧机器,正变身为能低成本迭代大规模模型的超级电脑。

尽管目前利用率仍有提升空间,且存在不小的工程挑战,但大门已经敞开。正如开发者所言,这种人机协作的逆向探索,让我们看到了端侧 AI 训练的曙光。未来,你手中的MacBook或许不再只是消费工具,而是一个随时随地进化的私密大脑。