毕设笔记(四)
Analog memristive synapse based on topotactic phase transition for high-performance neuromorphic computing and neural network pruning(基于拓扑相变的模拟忆阻突触:用于高性能神经形态计算和神经网络剪枝)
研究内容:
提出并实现了一种基于
使用第一性原理计算和动力学蒙特卡洛模拟,研究了TPT-RAM的取向相关开关机制。双模式TPT-RAM被用来模拟突触选择性稳定过程,并实现神经网络剪枝。
特点和优势
TPT-RAM与其他NVMs的对比
传统NVMs的不足:
- 电阻式随机存储器(RRAM):
- 依赖于无序氧空位的迁移(例如非晶态氧化物),导致设备变异性大。
- 界面型RRAM缺乏局部焦耳加热效应,表现出较差的保留特性和低速率。
- 相变存储器(PCM):
- 开关过程高度不对称,由晶态-非晶态相变中的急速冷却导致。
- 受导电漂移问题影响,限制其长期性能。
- 整体挑战:
- 这些器件存在固有的工作机制局限性,仅通过优化设备结构难以完全克服。
- 主要局限于模拟单个神经元或突触功能,未能有效模拟神经网络级别的特性(如神经网络修剪)。
- 电阻式随机存储器(RRAM):
TPT-RAM的优势:
- 更高的均匀性:基于拓扑相变,TPT-RAM能够控制氧离子沿高度有序的氧空位通道迁移,提供了更可预测和更稳定的性能。
- 多功能性:具有双模式(扩散性非易失性模式)的特性,能够模仿神经网络中的突触选择性稳定化过程,同时支持神经网络修剪。
TPT-RAM的特点与设计思路
材料选择:
- 使用
材料作为电阻切换层。 的棕褐石(BM)结构和钙钛矿(PV)结构提供了理想的氧离子迁移通道。 - 这种材料特性使得氧离子能够在高度有序的氧空位通道内迁移,易于通过调整氧化学计量实现可逆的相变。
- 使用
核心机制:
- 通过电场驱动,氧离子在顶电极和底电极之间沿氧空位通道迁移,触发BM-PV相变。
- 相变可控制切换为多级导电状态,实现模拟开关功能。
设备设计:
- 晶向优化:
- 在不同取向的
衬底上外延生长 ,优化氧空位通道的取向,使其更有利于电场驱动的氧离子迁移。
- 在不同取向的
- 结构特点:
- 利用氧八面体与四面体的交替堆叠实现高质量氧空位通道。
- 引入保护层(如
)提高设备稳定性。
- 晶向优化:
目标性能:
- 降低变异性:通过高度有序的氧离子迁移路径显著减少设备间和循环间的变异性。
- 增强模拟性能:提供多级导电状态和线性权重更新特性,满足高精度和高能效计算的需求。
- 支持神经网络优化:通过双模式特性在在线训练中实现神经网络修剪,从而减少冗余连接并提高整体效率。
研究结果
TPT-RAM的取向依赖性切换特性
研究背景与目标
- 目标:研究基于不同晶体(STO)取向的
(SCO)薄膜对拓扑相变随机存储器(TPT-RAM)切换特性的影响,重点分析氧离子迁移路径及其对性能均匀性和速度的影响。 - 研究重点:通过控制氧空位通道(OVCs)的方向,探讨其在BM(棕褐石)到PV(钙钛矿)相变中的作用机制。
实验设计
样品制备:
- 使用脉冲激光沉积法(PLD),在不同取向的
(STO)衬底上外延生长SCO薄膜:- (001)取向:OVCs平行于薄膜表面,沿面内方向排列。
- (110)取向:OVCs具有显著的面外(垂直)分量。
- 薄膜上覆盖20 nm厚的
保护层,定义器件区域后在顶部电极沉积100 nm厚的Au顶电极(TE), 金属 SRO( ) 用作底电极 (BE)。Au 和 SRO 均能与 BM-SCO 形成欧姆接触,这一特性对消除界面势垒的影响并获得对称的 I-V 特性至关重要。
- 使用脉冲激光沉积法(PLD),在不同取向的
晶体表征:
- 使用X射线衍射(XRD)和透射电镜(STEM)分析两种薄膜的晶体结构,明确OVCs的方向。
- 结果:
- OVCs在(001)取向中排列于平面内。
- OVCs在(110)取向中表现出明显的垂直分量,有利于电场驱动的氧离子迁移。
器件性能分析
成形电压与循环特性:
- 比较了(001)和(110)取向设备的成形过程和循环I-V曲线:
- (001)取向:平均成形电压为5.04 ± 0.07 V,变异性较高。
- (110)取向:平均成形电压为3.98 ± 0.05 V,表现出更低的变异性。
- 循环均匀性:
- (110)取向设备的导电状态和开关电压的循环变异性显著低于(001)取向。
- 比较了(001)和(110)取向设备的成形过程和循环I-V曲线:
导电切换均匀性:
- 对500次切换循环中设备导电特性进行统计:
- (110)取向:高阻态(HRS)和低阻态(LRS)的变异性分别为2.25%和13.74%,显著优于(001)取向。
- 归因于(110)取向中的OVCs沿电场方向对氧离子迁移路径的有序引导。
- 对500次切换循环中设备导电特性进行统计:
操作速度与能耗:
- 使用脉冲测试评估设备的切换速度:
- (001)取向:达到目标导电状态需要更高电压(~2.0 V)和更长时间(~10 µs)。
- (110)取向:能够以更低电压(~0.8 V)和更快速度(~100 ns)实现切换。
- 使用脉冲测试评估设备的切换速度:
理论分析与模拟
氧离子迁移路径计算:
- 通过密度泛函理论(DFT)计算分析不同方向的氧离子迁移能垒:
- 沿OVCs迁移的能垒为0.56 eV。
- 垂直于OVCs迁移的能垒显著更高,为0.97 eV。
- 跨越八面体层的迁移能垒为1.84 eV。
- 结果表明氧离子优先沿OVCs方向迁移。
- 通过密度泛函理论(DFT)计算分析不同方向的氧离子迁移能垒:
动力学蒙特卡洛(KMC)模拟:
- 建立模型模拟电场下氧离子迁移和相变:
- (110)取向:OVCs与电场方向一致,迁移路径明确,易于形成导电丝。
- (001)取向:OVCs与电场方向垂直,氧离子迁移路径随机性更高,导致非均匀相变。
- 建立模型模拟电场下氧离子迁移和相变:
关键结论
- (110)取向中OVCs的垂直排列增强了离子迁移的有序性,显著提高了切换均匀性、速度和效率。
- (001)取向中随机迁移路径导致较高的循环变异性和更高的操作电压。
TPT-RAM的模拟开关特性
研究目标
- 探讨基于(110)取向
(SCO)的拓扑相变随机存储器(TPT-RAM)的模拟切换特性,评估其在线性切换、导电状态稳定性、多级存储能力和长期耐久性方面的表现。
实验与结果分析
长时增强(LTP)与长时抑制(LTD)特性:
- 通过1 μs宽度、1、1.5 和 2 V幅值的连续脉冲测试,研究设备的模拟切换行为:
- 每个周期包括50个正向(增强)脉冲和50个负向(抑制)脉冲。通过读脉冲(幅值为 0.2 V,宽度为 1 μs)测量器件电导。
- 结果显示,设备在低电压(1 V)下实现了几乎线性的导电状态调整。
- 非线性因子:
- LTP:0.20。
- LTD:1.29。
- 该值显著优于典型电阻式随机存储器(RRAM)。
- 通过1 μs宽度、1、1.5 和 2 V幅值的连续脉冲测试,研究设备的模拟切换行为:
重复编程与线性化改进:
- 对设备进行多次循环测试以评估其可重复性和均匀性:
- 使用幅值逐渐递增的脉冲(1 V到2.89 V),切换线性显著改善(相比于在相同脉冲下,幅值为 1 V,宽度为 1 μs),同时提高了导电状态的开关比。
- 表明脉冲幅值设计能够进一步优化设备性能。
- 对设备进行多次循环测试以评估其可重复性和均匀性:
多级存储与保持特性:
- 导电状态保持性:
- 在85°C高温下测试不同导电状态的保持时间,结果显示稳定性超过3000秒。
- 通过温度依赖测试估算,室温下该器件的保留时间超过10年。
- SCO (110)pc中定向氧空位通道(OVCs)的存在,使得该器件可以通过更低的迁移势垒轻松编程,同时由于更高的扩散势垒,具备优异的保持特性。
- 多级存储能力与循环稳定性:
- 使用幅值从1.8 V到3.2 V的脉冲对设备进行
次循环切换,测试显示器件在不同电阻开关窗口下均保持稳定,具有良好的耐久性。
- 使用幅值从1.8 V到3.2 V的脉冲对设备进行
- 导电状态保持性:
扩散性与非易失性双模式:
- 测试表明,器件经历成型过程后(见1.3.1成型电压)表现为非易失性,而在成型之前,器件表现为扩散性忆阻特性,TPT-RAM具有扩散性和非易失性双模式特性:
- 扩散模式:弱电压激励下,器件呈现出时间依赖的扩散特性,导电状态会自然衰退回初始值。这是因为:由于BM相的绝缘特性,器件开始时表现出高电阻(>1 MΩ)。当施加低于成型电压的弱激励(例如,2 V)时,氧离子从SRO层被提取到SRO/SCO界面,降低了器件电阻。然而,这种激励不足以支持SCO完成稳定的相变,因为稳定相变需要足够多的氧离子。一旦移除电压偏置,界面处的化学势差会驱动氧离子回流至SRO层,导致器件逐渐恢复至初始的高阻态(HRS)。
- 非易失性模式:强激励或连续脉冲操作触发设备形成稳定的导电丝,导电状态长期保持不变。这是因为:在强激励下(例如,约4 V的直流成型电压),大量氧离子被驱入SCO,触发稳定相变。此后,小的正电压可以吸引更多氧离子迁移,诱导SCO从BM相向PV相的稳定相变,从而增加器件电导(设置过程)。当施加负电压时,氧离子被驱回SRO,发生反向相变,降低器件电导(复位过程)。因此,在这种非易失模式下,器件表现出相对较低的电阻和优异的保持性能。
- 器件可以从扩散模式转变为非易失模式,器件既可以通过单一高电压成型(施加激励大于所需成型电压),也可以通过足够多的小电压重复脉冲成型(施加足够多脉冲数量的低电压连续脉冲)。
- 通过脉冲数量和幅值的调节,可控制设备在两种模式之间切换。
- 测试表明,器件经历成型过程后(见1.3.1成型电压)表现为非易失性,而在成型之前,器件表现为扩散性忆阻特性,TPT-RAM具有扩散性和非易失性双模式特性:
性能比较与优势
- 线性与非线性因子改进:
- 与传统RRAM相比,TPT-RAM在模拟切换中的线性因子显著降低,支持高精度神经网络权重更新。
- 多功能性与稳定性:
- 具有多级存储能力、良好的保持特性和高循环耐久性。
- 低功耗与高效率:
- 模拟切换可在低电压(~1 V)下实现,减少了功耗需求,同时提高了计算效率。
进行神经网络剪枝
研究背景与目标
背景:
- 在人类大脑的发育过程中,突触连接在早期达到峰值,随后通过选择性稳定化和修剪过程精简神经网络,保留高效连接以优化认知能力。
- 类脑计算硬件面临挑战:如何模仿生物神经网络中重要的网络级功能(如神经网络修剪),同时降低复杂性和功耗。
目标:
- 利用TPT-RAM的扩散性与非易失性双模式特性,模仿生物神经网络的突触修剪过程,创建稀疏、高效的人工神经网络。
实现方法
神经网络修剪机制:
- TPT-RAM器件的两种模式与突触行为的对应关系:
- 扩散模式:突触连接处于不稳定状态,导电值会逐渐衰退(对应低活跃突触被削弱或移除)。
- 非易失性模式:经过频繁更新的突触连接达到稳定状态(经历电成型并最终进入非易失态),导电值保持不变(对应稳定突触被强化)。
- TPT-RAM器件的两种模式与突触行为的对应关系:
硬件实现:
- 设计差分对TPT-RAM器件,每对设备表示一个突触权重,初始时,所有突触器件都工作在扩散模式。
- 网络训练期间:
- 高频使用的突触:电压脉冲逐步增强,触发TPT-RAM从扩散模式切换至非易失性模式,形成稳定的突触连接。
- 低频使用的突触:由于缺乏足够激励,设备导电值自然衰退,最终实现突触修剪。
神经网络模拟:
- 使用两个模型验证TPT-RAM的修剪功能:
- 多层感知机(MLP):架构为784 × 100 × 10。
- 卷积神经网络(CNN):基于LeNet-5,包括卷积层、池化层和全连接层。
- 在训练过程中引入“休息阶段”,未激活的突触自然衰退,强化活跃的突触。
- 使用两个模型验证TPT-RAM的修剪功能:
实验结果
修剪效果:
- 使用MNIST手写数字分类任务测试网络性能:
- MLP:修剪率达到73.8%,电源功耗降低38%。
- CNN:修剪率达到84.2%,电源功耗降低63%。
- 通过修剪减少冗余突触,网络有效避免过拟合。
- 使用MNIST手写数字分类任务测试网络性能:
分类精度提升:
- 修剪后的网络在MNIST分类任务中,分类精度提高至99%。
效率与功耗优化:
- 网络复杂性显著降低,存储和计算资源需求减少,使得TPT-RAM硬件适用于资源有限的设备(如便携式电子设备和物联网应用)。
TPT-RAM特性优势
- 扩散与非易失性双模式:
- 自然地模拟生物神经网络的突触动态,支持在线训练中的突触修剪过程。
- 稀疏化网络生成:
- 自动调整网络结构,仅保留高活跃连接,避免传统修剪方法产生的硬件开销和计算负担。
- 低功耗与高精度:
- 模拟神经网络过程中功耗显著降低,同时增强分类任务的准确性。
实验结论
TPT-RAM的创新性:
- 设备原理:
- 提出了基于
(SCO)的拓扑相变随机存储器(TPT-RAM),其核心机制是氧离子沿高度有序的氧空位通道(OVCs)迁移,触发BM(棕褐石)到PV(钙钛矿)的相变。
- 提出了基于
- 性能优势:
- 高均匀性:循环间变异性仅~0.9%,设备间变异性仅~4.9%。
- 快速低功耗操作:操作电压低至0.8 V,切换速度低于100 ns。
- 设备原理:
拓扑相变的可控性:
- 物理机制验证:
- 利用第一性原理计算(DFT)和动力学蒙特卡洛(KMC)模拟,确认氧离子迁移路径与OVCs取向密切相关。
- 优化OVCs排列可显著提升设备的切换均匀性和效率。
- 材料设计意义:
- 强调通过控制离子迁移路径优化相变器件性能的重要性,为未来高性能存储设备设计提供指导。
- 物理机制验证:
独特的双模式特性:
- 扩散性与非易失性模式:
- 在扩散模式下,设备表现出时间依赖的记忆行为(短期记忆)。
- 在非易失性模式下,设备形成稳定导电通道(长期记忆)。
- 生物拟态能力:
- 双模式特性使TPT-RAM能够模拟生物突触的选择性稳定化和神经网络修剪过程。
- 扩散性与非易失性模式:
未来优化与应用:
- 提出进一步结合硅基晶体管构建功能性突触阵列的潜力。
- 推荐采用远程外延技术或牺牲层辅助薄膜转移技术,以优化TPT-RAM的集成工艺和规模化生产。
实验方法
1. 薄膜生长与表征条件
薄膜生长条件:
- 沉积方法:反射高能电子衍射(RHEED)辅助的脉冲激光沉积(PLD)。
- 生长参数:
- 温度:750°C。
- 氧气环境:100 mtorr。
- 激光波长为248 nm(KrF激光器)。
- 激光能量:1.2 J/cm²。
- 激光重复频率:2 Hz。
- 样品厚度:
(SCO)薄膜:35 nm。 (SRO)薄膜:17 nm。
- 冷却过程:
- 冷却速率:7°C/min。
- 氧气环境:100 mtorr。
薄膜表征方法:
薄膜厚度通过生长时间控制。
- 晶体结构:
- X射线衍射(XRD)。
- Reciprocal Space Mapping(RSM)。
- 原子结构:
- 原子分辨率扫描透射电子显微镜(STEM)。
2. 设备制造与测试方法
设备制造过程:
- 绝缘层:
- 材料:20 nm厚的
。 - 工艺:原子层沉积(ALD)。
- 材料:20 nm厚的
- 接触通孔:
- 尺寸:从4×4 μm²到100×100 μm²。
- 定义了设备的活动区域。
- 电极材料:
- 底电极(BE):SRO。
- 顶电极(TE):接触孔顶部使用磁控溅射法沉积了厚度为100 nm的Au电极,其尺寸为100 × 100 μm²。
电学性能测试方法:
- 测试仪器:
- 半导体参数分析仪(Agilent B1500)。
- 脉冲发生器(Agilent 81110A)。
- 开关矩阵(Keithley 707)。
- 测量内容:
- I-V特性测试:包括成形电压、循环切换和多级存储特性。
- 脉冲响应测试:评估设备的切换速度、导电状态稳定性和循环耐久性。
3. 神经网络模拟
网络架构:
- 多层感知机(MLP):
- 网络结构:784 × 100 × 10。
- 卷积神经网络(CNN):
- 使用LeNet-5架构,包括:
- 3个卷积层。
- 2个池化层。
- 1个全连接层。
- 1个径向基函数(RBF)输出层。
- 使用LeNet-5架构,包括:
模拟过程:
- 权重表示:
- 使用两片基于 SCO (110)pc的TPT-RAM器件组成的差分对表示一个突触权重。
- 训练算法:
- 标准反向传播(Backpropagation)。
- 随机梯度下降(SGD)。
- 批量大小:200。
- 学习率:0.01。
- 训练过程:
- MLP训练周期:10轮。
- CNN训练周期:20轮。
- “休息阶段”:
- 模拟人类学习过程中的突触稳定化。
- 高活跃突触被强化(转入非易失性模式),低活跃突触自然衰退(扩散模式)。
- 设备特性模拟:
- 模拟过程中加入实验提取的循环变异性和符合高斯分布的噪声模型。
- 性能评估:
- 使用MNIST手写数字数据集测试分类精度。
- 修剪率计算:修剪后的零权重突触数量占比。
PDF展示:
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 Rei的小站!