- 马慧琴;杜瑀;迟琳琳;时拓;
随着自动驾驶、智能机器人等应用的迅猛发展,叠加大模型向端侧部署的迫切需求,导致视觉处理数据量激增。传统计算架构面临的“存储墙”与能耗瓶颈越发显著,难以支撑新一代智能应用的高效处理需求。面向神经形态计算的视觉感存算一体化技术,通过在传感端原位集成感知、存储与计算功能,为突破上述瓶颈提供了解决方案。本文旨在系统梳理该领域的研究进展。首先,介绍视觉传感器计算架构的演化;其次,深入探讨支撑该架构的关键功能材料,包括氧化物材料、二维材料与铁电材料;再次,总结感存算一体化阵列在集成工艺层面取得的最新突破,并分析面向神经形态计算的主要应用,如储备池计算、运动检测、事件驱动计算和自适应计算;最后,讨论当前神经形态视觉传感器发展面临的核心挑战与未来方向。
2025年04期 1-18页 [查看摘要][在线阅读][下载 1984K] - 顾高名;汪一帆;王超;梁嘉铠;岳克强;李文钧;郑兴;
随着脉冲神经网络(SNN)在人工智能领域中被广泛应用,SNN硬件加速器的性能需求也在日益增加。对于通用硬件推理工具CPU,其受限于冯·诺依曼架构,面对大量重复运算时,需要反复从存储区将数据搬运至计算区,耗费大量时间。而大多数SNN专用硬件加速器仅实现了定制化计算,适配特定的神经元模型、神经网络模型,当模型变换时,需要频繁地重新设计专用的硬件加速器。为了解决这个问题,本文提出了一种可重构脉冲神经网络硬件计算系统设计,通过分析神经元膜电位更新的共性,采取后序表达式的方法描述神经元模型,采用片上网络(NOC)作为系统的主体通信方式,并针对脉冲神经网络的推理作了路由规则的优化。实验结果表明,本系统可以实现对不同神经元模型、不同神经网络模型的模型推理计算。本系统吞吐量达到了205.98 GOPS,能效比约为1.3 GOPS/W。在与CPU和GPU的对比中,本文所设计的可重构脉冲神经网络硬件加速平台,在帧率和能耗比上更有优势,而准确率依旧保持相对不错的水平。此外,本平台还和其他平台进行了对比,本文在支持可重构的同时,在帧率和能效比上有明显的优势。
2025年04期 19-29+52页 [查看摘要][在线阅读][下载 1546K] - 赵毅;王向杲;
近年来,人工智能技术发展迅速引发了神经形态芯片的研究热潮。神经形态芯片期望能够模拟人脑神经网络的并行计算以及低功耗特性,有望突破传统计算架构在智能任务处理方面的瓶颈。自旋转移矩磁性随机存储器(Spin Transfer Torque Magnetic Random Access Memory,STT-MRAM)因其具有非易失性、高耐久性、低功耗,以及与CMOS工艺兼容性等优点,成为构建神经形态芯片的理想存储介质选择。本文对基于STT-MRAM的神经形态芯片研究现状与挑战进行了系统梳理。首先,阐述了神经形态计算的兴起背景,剖析了冯·诺依曼架构的局限性以及存内计算技术对神经形态芯片的适配情况;其次,详细介绍了STT-MRAM的工作原理和特性,综述了基于其数字域与模拟域的神经形态芯片实现方案以及典型研究成果;再次,从器件、电路、架构,以及算法层面探讨了该领域面临的核心挑战(如器件稳定性、信号衰减、算力密度与计算精度等问题);最后,总结了STT-MRAM神经形态芯片的应用潜力,还展望了多维度协同优化等未来研究方向。本文可为相关领域研究人员提供全面参考,推动STT-MRAM在神经形态计算中的实用化发展。
2025年04期 30-40页 [查看摘要][在线阅读][下载 7410K] - 罗强;宗鹏陈;夏天;赵文哲;任鹏举;
在图神经网络等人工智能应用与数据库支撑的机器学习训练流程中,链式数据结构(Linked Data Structures,LDS)被广泛使用。然而,LDS的访问通常会出现指针追踪(Pointer-chasing)现象,并伴随高度不规则的内存访问和强数据依赖性,导致现有的预取技术难以有效预测其访问模式进而成为系统性能的关键瓶颈。基于此,本文提出了一种高效的硬件预取机制—先进链表预取器(Advanced Linked-list Prefetcher,ALP),通过快速识别链表结构中具有固定偏移(offset)关系的内存访问行为实现对下一链表节点的准确预取。该方法基于程序计数器(PC)与地址响应数据之间的模式匹配,设计了一种低开销、组相联的快速检测表(QST)以及访存模式表(RT),用于动态识别链式访问关系,并结合优先级调度策略保障关键预取请求的及时发出。ALP采用链式预取策略,当预取数据回填时会自动触发后续节点的预取,显著降低了指针访问带来的串联延迟。在GEM5模拟器上实现了ALP,并在多项代表性基准测试中进行评估。实验结果显示,ALP相对于Stride预取器平均可带来高达1.5倍的性能提升,且仅引入约1.14 KB的硬件开销。
2025年04期 41-52页 [查看摘要][在线阅读][下载 2789K] - 胡有能;李一涛;金孝飞;康子扬;马德;潘纲;
类脑计算通过模拟人脑神经结构实现存算一体与超低功耗,是突破传统冯·诺依曼架构瓶颈的新型计算范式。而随着以Deep Seek为代表的大模型的急速发展,传统的硬件计算体系面临巨大的挑战。类脑计算芯片凭借存储处理一体化、超低能耗、超大规模并行的特点,使其成为AI算力“后摩尔时代”的破局关键。本文以类脑计算芯片为核心,首先对目前国内外类脑芯片的几种发展路径与成果等研究现状进行了阐述,其次针对其实现所面临的挑战和关键技术进行了分析,最后对其未来的发展方向及可能突破的关键点进行了展望,旨在引发更多学者的研究兴趣以及如何更好更快地推进类脑硬件的发展。
2025年04期 53-67页 [查看摘要][在线阅读][下载 2427K]