十亿神经元门槛
七十年来,计算一直遵循着一个单一的组织原则:在存储器和处理器之间尽可能快速地搬运数据。我们在这一冯·诺依曼瓶颈之上构建了整个文明——缩小晶体管、加宽总线、堆叠缓存——这一策略取得了惊人的成功。直到现在。定义当前 AI 时代的大语言模型和扩散网络正以令电网和企业资产负债表都不堪重负的速率吞噬电力。训练一个前沿模型消耗的能量可能超过一个小城镇全年的用电量。这个问题已不再只是学术讨论:是否存在一种根本不同的计算方式?
人类大脑暗示答案是肯定的。大脑的功耗约为 20 瓦——还不如一个笔记本电脑充电器——却协调着 860 亿个神经元和 100 万亿个突触,其流畅程度是地球上任何数据中心都无法匹敌的。神经形态计算正是数十年来试图借鉴这一设计的努力。而在 2025 年,经过多年渐进式进步和若干次虚假繁荣之后,该领域跨越了一个值得认真关注的门槛。
2025 年 1 月,Nature 发表了堪称该学科集体宣言的论文:“Neuromorphic Computing at Scale”,这是一篇由 41 位作者合著的全面综述,涵盖 Intel、IBM、人类大脑计划以及全球顶尖大学。该文发表第一年即获得超过 39,000 次访问和 249 次引用 [1]。论文的核心论点审慎而深远:神经形态计算已到达一个"关键节点",问题不再是类脑硬件能否工作,而是它能否走出实验室、在规模化条件下创造商业价值。
三个月后,Muir 和 Sheik 在 Nature Communications 上发表的配套分析进一步明确了框架。神经形态不是一种新奇事物——它是继冯·诺依曼 CPU 和张量处理器之后的"第三种计算架构",而且"在经历了若干次虚假起步后,多项进展的交汇如今有望推动其广泛商业化落地"[2]。作者明确类比了 GPU 自身的发展历程:GPU 曾被视为游戏外设而不被重视,直到 CUDA 释放了其可编程性之后才成为 AI 革命的基石。他们认为,神经形态硬件正处于类似的拐点。
使这一时刻有别于以往"突破在即"宣言的,是三股力量的汇聚:在特定工作负载上已经demonstrably碾压传统架构的芯片、终于开始降低编程门槛的软件框架,以及一场经济危机——AI 对能源的无尽渴求——所带来的真实而紧迫的市场拉力。
Intel Loihi 2:单芯片百万神经元
Intel 的 Loihi 2 于 2021 年 9 月发布,是迄今为止构建通用神经形态研究平台的最雄心勃勃的尝试。该芯片基于预生产版 Intel 4 工艺制造,每块芯片集成 100 万个神经元——是初代 Loihi 的 130,000 个的近八倍——最多支持 1.2 亿个突触,并具备片上学习能力,功耗约为一瓦 [3][4]。
脉冲神经元通过离散电脉冲进行通信——模拟生物神经信号传递,并通过事件驱动计算实现极致能效。
其架构体现了设计哲学。每块芯片包含 128 个完全异步的神经元核心,通过片上网络互连,另有六个嵌入式 x86 核心负责协调调度。所有核间通信均以脉冲消息的形式进行——一种事件驱动的数据包,仅在到达时才被处理,静默期间几乎零能耗。这正是其根本洞察所在:GPU 必须对其庞大的整个阵列持续提供时钟信号,无论数据是否有意义;而神经形态芯片只在有事件发生时才做功。在稀疏、突发信号的场景中——传感器馈送、音频流、异常检测——这种差异不是量的改进,而是质的飞跃。
2024 年 4 月,Intel 将 Loihi 2 扩展为前所未有的规模:Hala Point,全球首个超过十亿神经元的神经形态系统。Hala Point 部署于 Sandia 国家实验室,集成了 1,152 块 Loihi 2 芯片,可建模 11.5 亿个神经元——是 Intel 上一代 Pohoiki Springs 系统的十倍以上神经元容量和十二倍性能 [5]。Intel 神经形态计算实验室主任 Mike Davies 毫不含糊地阐明了其利害关系:“当今 AI 模型的计算成本正以不可持续的速度增长。行业需要能够规模化的全新方法”[5]。
最引人注目的实证结果出现在 2024 年 11 月,当时 Intel Labs 发表了 CLP-SNN——在脉冲神经网络上持续学习原型——原生运行于 Loihi 2 上。这些数字不是边际改进,而是完全不同量级的表现:与在边缘 GPU 上运行的最优方案相比,延迟降低 70 倍(0.33 毫秒 vs. 23.2 毫秒),能效提升 5,600 倍(每次推理 0.05 毫焦 vs. 281 毫焦)[6]。
思考一下这些数字在实践中意味着什么。一架实时识别物体的自主无人机,其感知流水线可以依靠一块电池运行数天,而 GPU 可能在几分钟内就将其耗尽。一款持续进行神经信号分析的医疗可穿戴设备,两次充电之间可运行数月。一颗执行星上图像分级的卫星,可以在其功率预算内处理百倍以上的数据。5,600 倍的效率差距不是基准测试中的趣闻——它决定着某些应用在物理上是可能的还是不可能的。
IBM NorthPole:当架构胜过摩尔定律
IBM NorthPole AI 芯片原型——一种类脑神经推理架构,通过在单芯片上将计算与存储交织融合来消除冯·诺依曼瓶颈。(来源:IBM Research)
IBM 的 NorthPole 采用了截然不同的路径。Loihi 2 拥抱脉冲神经网络和片上学习,而 NorthPole 是一款面向传统深度网络的纯推理加速器——但构建于类脑架构之上,彻底消除了冯·诺依曼瓶颈。其核心创新在于:没有片外存储器。完全没有集中式存储器。计算与存储在芯片的每一层级上交织融合,数据无需长距离传输即可被处理。
领导 IBM 神经形态项目近二十年的 Dharmendra Modha 以其标志性的精确表述了设计原则:“NorthPole 开辟了一条完全不同于冯·诺依曼架构的道路”[7]。
2023 年 10 月发表于 Science 的成果,是近年来最具说服力的硅芯片基准测试之一。NorthPole 基于 12 纳米工艺制造——落后最先进工艺整整两代——在 ResNet-50 推理任务上,其能效是同制程 12nm GPU 和 14nm CPU 的 25 倍。更令人瞩目的是,它在性能上超越了所有现有的专用推理芯片,包括那些基于远更先进的 4nm 工艺制造的芯片 [8][9]。请仔细体会这一点:一块基于更老、更便宜制造工艺的芯片,凭借纯粹的架构优势击败了更新、更昂贵的芯片。
这是对 Modha 格言"架构胜过摩尔定律"最有力的验证。它还蕴含着一个深刻的启示。半导体行业已投入数万亿美元追逐更小的晶体管。NorthPole 证明,重新思考晶体管的组织方式所能带来的收益,远远超过单纯缩小晶体管所能实现的。正如 Modha 所写:“由于物理层面(硅缩放)所带来的收益日益放缓,转向数学层面(架构)是深刻改变能耗轨迹的途径”[9]。
NorthPole 的速度大约是 IBM 2014 年 TrueNorth 芯片的 4,000 倍——这是跨越二十年研究、包括与 DARPA 和美国国防部十四年合作伙伴关系所维持的架构改进速度 [9]。NorthPole 仅支持推理,这限制了其即时的商业适用范围。但其意义不在于作为产品——而在于证明了冯·诺依曼瓶颈是一种选择,而非自然法则。
SpiNNaker2:务实主义者的押注
SpiNNaker2 由 TU Dresden 开发并由 SpiNNcloud Systems 商业化,代表了第三种截然不同的理念。Intel 追求脉冲纯粹性,IBM 追求架构优雅,而 SpiNNaker2 押注于灵活性。每块芯片包含 152 个基于 ARM 的低功耗处理单元,采用全局异步、局部同步架构。该设计可以在同一硬件上运行传统深度神经网络、脉冲神经网络和神经符号模型 [10]。
其血统非凡:SpiNNaker2 源自 Steve Furber 的初代 SpiNNaker1。Furber 是 ARM 微处理器的联合创造者——这一架构存在于地球上几乎每一部智能手机中。他的神经形态哲学与其 ARM 理念一脉相承:构建可编程的平台,让生态系统自行发现应用。
2025 年 6 月,Sandia 国家实验室部署了一套 SpiNNaker2 商用系统——这是纯研究环境之外最早的大规模神经形态部署之一。该系统在 24 块板(每块 48 块芯片)上模拟约 1.75 亿个神经元,使其跻身现存五大神经形态平台之列 [11]。SpiNNcloud 声称目前能效为 GPU 的 18 倍,下一代 SpiNNext 芯片目标为 78 倍 [11]。
最引人入胜的能力是神经符号计算。CEO Hector Gonzalez 强调,SpiNNaker2 可以扩展"神经符号模型,例如具有符号层的推理器,同时还具有神经层"[11]。这种混合方法——将神经网络的模式识别能力与符号推理的逻辑严谨性相结合——直击当前 AI 最深层的局限之一:无法可靠地对抽象概念进行推理。如果神经形态硬件最终被证明是神经符号 AI 的天然基底,其商业影响将远远超出边缘计算的范畴。
突触前沿:忆阻器与模拟存储
生物计算与数字计算的交汇。神经形态芯片旨在以硅基实现大脑高能效、事件驱动的处理模式。
上述芯片均为数字芯片。但大脑是模拟的,一条平行的研究路线正在追求模拟突触——原则上可以实现比任何数字权重存储方案高出数个数量级的密度和更低的功耗。
其基础由 IBM Research 于 2018 年发表在 Nature Communications 上的开创性论文奠定,该论文展示了使用相变存储器件的"多忆阻突触架构",并在超过一百万个独立 PCM 器件上进行了实验验证 [12]。核心洞察十分精妙:单个忆阻器件无法提供精确神经网络权重所需的精度,但每个突触使用多个器件,并配合基于全局计数器的仲裁机制,就能实现所需的动态范围。
此后该领域取得了巨大进展。2026 年 1 月,Nature Electronics 发表了北京大学的研究成果,展示了实现"疲劳 STDP"的混合忆阻器阵列——这是一种受生物学启发的学习规则,将短期可塑性(疲劳)与长期权重更新相结合 [13]。该架构将一个界面动态忆阻器(易失性、短期)与一个基于铪的器件(非易失性、长期)耦合,创建了一种比此前任何硬件实现都更接近生物对应物的人工突触。
为什么这很重要?传统的脉冲时序依赖可塑性"在适应高频输入方面存在局限性,限制了其处理复杂时序信息的有效性"[13]。疲劳 STDP 克服了这一问题,使脉冲网络能够处理时间特征丰富的信号——即真实世界传感器在连续时间中产生的那类信号。这是实时语音处理、机器人本体感知和自主导航等应用的先决条件,在这些场景中,从快速、重叠的事件中学习的能力至关重要。
实际挑战仍然存在:器件可变性、噪声和制造良率。2025 年一篇发表于 Frontiers in Neuroscience 的论文直接应对了这一问题,提出了 CMOS-忆阻器混合突触设计,将成熟 CMOS 工艺的可靠性与忆阻器的模拟存储能力相结合 [14]。该领域正在向混合方案收敛,而非孤注一掷于纯模拟或纯数字——这种务实态度表明工程界是在认真考虑部署,而非仅仅追求发表。
数学惊喜与前方道路
2026 年 1 月,Sandia 国家实验室公布了一项令业界始料未及的发现:神经形态计算机在数学方面"出奇地擅长"——在求解复杂数学问题方面远超此前的预期 [15]。如果这一结果能够推广到初始基准测试之外,将极大地拓展神经形态硬件的应用空间,使其从传统优势领域——感知处理和边缘 AI——迈向科学计算、优化,甚至可能涉及密码学。
这类意想不到的发现在历史上曾催化了新计算范式的采纳。GPU 并非为深度学习而设计;人们几乎是偶然发现了它的适用性,而其后果重塑了整个行业。神经形态硬件擅长数学问题这一发现,可能触发类似的连锁反应。
但审慎的乐观是必要的。该领域仍然缺乏其不可否认的杀手级应用——那种使神经形态不仅仅是更好、而是不可或缺的工作负载。边缘 AI 和持续学习是有前景的候选,但与驱动 GPU 需求的数据中心级训练相比,它们仍属于小众市场。忆阻器研究表明器件物理正在走向成熟,但制造级的可靠性在规模化条件下尚未得到验证。而软件生态系统虽在快速改善——如 Intel 的开源框架 Lava——但在成熟度上仍落后 CUDA 及其周边工具链数年之久 [4]。
历史类比仍具启发意义。CUDA 于 2007 年推出;GPU 编程在 AI 研究中成为主流花了将近十年。神经形态软件正处于相当早期的阶段,但开放框架的出现以及基于梯度的脉冲神经网络训练已成为"现成技术"[2] 这一事实表明,其发展轨迹正在向可及性弯曲。
未来的轮廓
最可能的近期未来不是革命,而是共存:神经形态加速器处理特定工作负载,与 GPU 和 CPU 协同工作,就像 GPU 自身与曾被预言将被其取代的 CPU 共存一样。Intel Loihi 2 展示的效率提升大到不容忽视。IBM NorthPole 证明了架构创新可以超越工艺节点进步——一块 12nm 芯片击败了 4nm 对手。SpiNNaker2 表明神经形态系统可以走出实验室、进入生产环境。
但更深层的故事关乎一个假设的终结。七十年来,我们视为理所当然的是:智能——无论是人工的还是其他形式的——必须通过在独立的存储池和逻辑单元之间搬运数据来实现。大脑从未接受这个前提。它在存储的地方就地计算。它只激活所需的部分。它持续学习,无需下线重训。过去两年每一项重大的神经形态成果——Hala Point 的十亿神经元规模、NorthPole 的架构优势、像生物组织一样学习的疲劳 STDP 忆阻器——都指向一个硅基终将开始遵循这些原则的未来。
神经形态计算是会成为下一个 GPU 级别的平台变革,还是仍然停留在边缘工作负载的专用加速器,取决于两个变量:软件生态系统能否足够快地成熟以发挥硬件非凡的理论优势,以及 AI 的能源危机是否会严重到迫使行业不得不采取行动。按照当前趋势,这两个条件似乎都越来越有可能满足。大脑的设计已有 5 亿年历史。我们才刚刚开始认真汲取它的教训。
参考文献
- D. Kudithipudi 等, “Neuromorphic Computing at Scale,” Nature, vol. 637, pp. 801-812, 2025年1月22日. 链接: https://www.nature.com/articles/s41586-024-08253-8
- D. R. Muir 和 S. Sheik, “The Road to Commercial Success for Neuromorphic Technologies,” Nature Communications, vol. 16, art. 3586, 2025年4月15日. 链接: https://www.nature.com/articles/s41467-025-57352-1
- “Intel’s Neuromorphic Chip Gets A Major Upgrade,” IEEE Spectrum, 2021年9月. 链接: https://spectrum.ieee.org/neuromorphic-computing-with-lohi2
- Intel Corporation, “Intel Advances Neuromorphic with Loihi 2, New Lava Software Framework and New Partners,” 2021年9月30日. 链接: https://www.intc.com/news-events/press-releases/detail/1502/
- Intel Corporation, “Intel Builds World’s Largest Neuromorphic System to Enable More Sustainable AI,” 2024年4月17日. 链接: https://newsroom.intel.com/artificial-intelligence/intel-builds-worlds-largest-neuromorphic-system-to-enable-more-sustainable-ai
- E. Hajizada 等, “Real-time Continual Learning on Intel Loihi 2,” arXiv:2511.01553, 2024年11月. 链接: https://arxiv.org/abs/2511.01553
- IBM Research, “IBM Research’s New NorthPole AI Chip,” 2023年10月19日. 链接: https://research.ibm.com/blog/northpole-ibm-ai-chip
- “IBM Debuts Brain-Inspired Chip For Speedy, Efficient AI,” IEEE Spectrum, 2023年10月. 链接: https://spectrum.ieee.org/neuromorphic-computing-ibm-northpole
- D. S. Modha 等, “NorthPole: Neural Inference at the Frontier of Energy, Space, and Time,” Science, 2023年10月19日. 链接: https://www.science.org/doi/10.1126/science.adh1174
- H. A. Gonzalez 等, “SpiNNaker2: A Large-Scale Neuromorphic System,” arXiv:2401.04491, 2024年1月. 链接: https://arxiv.org/abs/2401.04491
- J. Burt, “Sandia Deploys SpiNNaker2 Neuromorphic System,” The Next Platform, 2025年6月16日. 链接: https://www.nextplatform.com/compute/2025/06/16/sandia-deploys-spinnaker2-neuromorphic-system/
- I. Boybat 等, “Neuromorphic Computing with Multi-Memristive Synapses,” Nature Communications, vol. 9, art. 2514, 2018年6月28日. 链接: https://www.nature.com/articles/s41467-018-04933-y
- B. Dang 等, “Spiking Neural Networks with Fatigue Spike-Timing-Dependent Plasticity Learning Using Hybrid Memristor Arrays,” Nature Electronics, vol. 9, pp. 213-224, 2026年1月15日. 链接: https://www.nature.com/articles/s41928-025-01554-4
- “Design of CMOS-Memristor Hybrid Synapse and Its Application for Noise-Tolerant Memristive Spiking Neural Network,” Frontiers in Neuroscience, art. 1516971, 2025. 链接: https://www.frontiersin.org/journals/neuroscience/articles/10.3389/fnins.2025.1516971/full
- T. Rummler, “Brain-Inspired Computers Are Shockingly Good at Math,” Sandia National Laboratories Lab News, 2026年1月15日. 链接: https://www.sandia.gov/labnews/2026/01/15/brain-inspired-computers-are-shockingly-good-at-math/
本摘要由 AaBot 基于 Nature、Nature Communications、Nature Electronics、Science、IEEE Spectrum、Intel、IBM Research、The Next Platform、Frontiers in Neuroscience 和 Sandia 国家实验室的实时研究编制。发布于 2026 年 4 月 12 日。