一种具有拓扑转化特性的铁氧体突触晶体管(A Ferrite Synaptic Transistor with Topotactic Transformation)

受生物神经形态系统的启发,模拟生物突触功能的人工突触器件的硬件实现备受关注。本文展示了一种基于晶相间拓扑相变的三端铁氧体突触器件。通过电解质门控控制的拓扑相变在褐铁矿 SrFeO2.5 和钙钛矿 SrFeO3δ 之间实现,并通过晶体和电子结构分析加以确认。利用门控可调的多级导电状态,成功构建了一种具有电解质门控铁氧体薄膜的突触晶体管,这些导电状态源自拓扑相变诱导的不同缺氧钙钛矿结构 SrFeOₓ。这种三端人工突触能够模拟重要的突触功能,如突触可塑性和脉冲时间依赖性可塑性。由铁氧体突触晶体管构成的神经网络的仿真结果表明,该系统具有较高的分类精度。这些结果为高级拓扑相变材料在设计高性能人工突触中的潜在应用提供了见解。

1.正文

人脑中的学习和记忆是通过生物突触网络之间连接强度的动态变化来实现的【1】。人脑能够更强大地处理数据和识别模式,主要得益于神经元之间这种突触连接的存在【2】。因此,设计具备生物突触功能的人工突触对于实现模拟突触功能的神经网络硬件化至关重要【3】。突触可塑性和非易失性是模仿突触中学习和记忆的关键特性【4】。基于硅的互补金属氧化物半导体(CMOS)电路利用数十个晶体管来模拟突触活动。然而,这种方法需要非常大的面积且消耗大量能量,从而阻碍了其进一步发展【6】。基于金属氧化物【7–12】、铁电材料【13,14】和相变材料【15,16】的两端子忆阻器,作为能够模拟突触功能的非易失性存储器引起了广泛关注,如突触可塑性和脉冲时间依赖性可塑性(STDP)。这些器件中的多种可调电阻状态被用于存储突触权重,展现出突触可塑性。 近年来,提出了三端电解质栅控晶体管用于人工突触的应用。由于具备额外的栅极控制,三端器件似乎更适合实现低能耗的突触功能【18–22】【4,23,24】。信号传输和学习过程可以同时进行,因为信号传输通过通道完成,而突触权重通过栅极端调控【17】。此类突触晶体管极大地丰富了类脑计算设备,为构建人工神经网络提供了一种有前景的方法【25,26】。这类器件的通道需要采用先进的薄膜材料,以在电解质栅控下实现多重电阻状态。

在功能氧化物中,拓扑相变可实现晶体相之间的可逆结构变化,这与作为相变存储基础的非晶态和晶态之间的相变不同【27】。拓扑相变通过调节氧化物中的氧化学计量比,提供了一种有效的方法来操控物理性质【28,29】。锶铁氧化物 (SrFeOx,SFO) 拥有拓扑相变特性,已在燃料电池、氧气传感器、电阻存储器和催化剂等多种技术应用中得到了研究【30–33】。SFO的晶体结构呈现多种不同的缺氧钙钛矿结构,氧化学计量比x在2.5至3之间变化【29,34–36】。其中,具有FeO6八面体与FeO4四面体交替层的褐钙矿(BM)SFO 为绝缘体,而通过氧原子填充空位的PVSFO,拥有以FeO6八面体为角共享的结构(图1b),表现出金属导电性【32,35,36】。目前,大多数研究是通过控制不同氧气环境下的氧化还原反应来实现SFO的拓扑相变,但这限制了其在类脑计算电子器件中的应用。近年来,离子液体栅控 (ILG) 作为一种新颖的材料性能调控方法,逐渐受到关注,它不仅通过静电效应,还通过离子迁移引发的相变来实现电化学效应【37-39】。Lu等的开创性研究显示,通过ILG控制的功能离子在钴酸盐薄膜中的插入和提取,可实现不同相之间的可逆相变【38】。这一成果表明,拓扑相变材料可能是用于电解质栅控突触晶体管通道的理想候选材料。
图 1. 电解质栅控下结构相的演变。

a,b) 沿着 SrTiO₃ 衬底的 [100] 方向,展示了褐钙钛矿 SrFeO₂.₅ (a) 和钙钛矿 SrFeO₃₋δ (b) 薄膜的示意晶体结构。

c,d) 原始褐钙钛矿相 SrFeO₂.₅ 薄膜的横截面 HAADF-STEM 图像 (c) 和面内 Sr-Sr 距离 (d)。

e,f) 栅控后的钙钛矿相 SrFeO₃₋δ 薄膜的横截面 HAADF-STEM 图像 (e) 和面内 Sr-Sr 距离 (f)。

在本研究中,我们通过电解质栅控实现了SrFeOx(2.5 ≤ x ≤ 3.0)外延薄膜的可逆拓扑相变。我们利用这种连续的拓扑相变构建了基于离子液体栅控的SFO薄膜突触晶体管。该突触晶体管展示了重要的突触功能,包括增强、抑制和脉冲时间依赖的可塑性(STDP)。这种在SFO薄膜中实现BM相和PV相之间拓扑相变的突触晶体管,为构建未来的类脑计算系统开辟了一条新途径。

采用脉冲激光沉积法在(001)取向的SrTiO3(STO)衬底上生长了BM-SFO外延薄膜(详见实验部分)。X射线衍射(XRD)和X射线倒易空间映射(RSM)图谱表明,所生长的薄膜包含面外BM相,其缺氧的FeO4四面体层垂直于薄膜表面(图S1a, b,支持信息)[34,36,40]。随后,我们通过离子液体栅控(ILG)研究BM相和PV相之间的结构转变。使用离子液体N,N-二乙基-N-(2-甲氧基乙基)-N-甲基铵双(三氟甲基磺酰)亚胺(DEME-TFSI)作为电解质栅控介质。由于拓扑相变的非易失性特征,我们可以进行各种非原位测试,以探究栅控后SFO薄膜的变化。经过ILG处理后,薄膜的晶体结构转变为类似PV的结构(图S1c, d,支持信息)。我们监测了SFO外延薄膜在ILG过程中进行的原位XRD θ2θ扫描,以直接观察结构相变(图S2,支持信息)。这些结构测试表明,通过ILG引发的BM相和PV相之间的转变是可控且非易失的。相变过程中所需的氧可能来自大气[41]以及离子液体中的水分含量[38,39]。扫描透射电子显微镜(STEM)结果进一步证实,SFO薄膜在原子尺度上通过ILG发生了BM相和PV相之间的相变。在高角度环形暗场(HAADF)STEM图像中,缺氧四面体(FeO4)和完全氧化的八面体(FeO6)子层交替堆叠,显示出周期性暗条纹(图1c)。四面体和八面体子层内Sr-Sr的平面原子间距分别约为4.4 Å和3.4 Å(图1d)。在SFO薄膜经过负向栅控后,典型的PV结构清晰可见(图1e),其平面内Sr-Sr原子间距约为3.83 Å(图1f)。从HAADF-STEM图像中获得的平面(面内)和面外晶格常数总结在支持信息的图S3中。

相关的电子能量损失谱(EELS)(图S4,支持信息)和X射线吸收光谱(XAS)(图S5,支持信息)也揭示了负向栅控后BM相向PV相的相变。初始的BM-SFO薄膜为绝缘体,而通过ILG形成的PV-SFO薄膜具有更高的导电性(图S6,支持信息)。此外,我们可以通过施加偏压栅控来电控转换薄膜的颜色,颜色从浅黄色变为不透明(图S7,支持信息)。所有这些物理特性使电解质栅控的SFO薄膜在构建高稳定性的突触晶体管方面具有极大的应用潜力。

我们设计了一种电解质栅控晶体管架构,使用原始的BM-SFO外延薄膜作为通道材料,以模拟生物突触的功能。图2a展示了该器件结构的示意图。利用标准光刻技术将生长的BM-SFO薄膜图案化为微米级通道,并布置同平面的栅电极(详见实验部分)。图2b显示了典型器件的光学图像,图中包含一滴DEME-TFSI电解液。栅极电压VG以1 mV/s的速度扫描,源-漏电压VSD为0.6 V。传输曲线显示出明显的滞回环,表明具有良好的可逆性(图2c)【41】。栅极泄漏电流IG比源-漏电流ISD小约两个数量级,反映出IG对器件性能的影响可以忽略不计(图2d)。通道可以在低导电态和高导电态之间可逆调控。随着VG从0扫向负值,器件导电性(电导率)增加;而当VG大于0时,器件导电性(电导率)降低。传输曲线与SFO薄膜的拓扑相变现象一致。负向栅控可触发SFO薄膜从绝缘的BM相转变为导电的PV相,而正向栅控可使SFO薄膜从导电的PV相回到绝缘的BM相。

图 2. 电解质栅控铁氧体晶体管

a) 晶体管结构和测量设置的示意图。SrFeOx 薄膜形成源(S)和漏(D)电极之间的通道,离子液体(DEME-TFSI)作为栅控介质

b) 一种典型铁氧体晶体管设备的光学图像,显示了离子液滴

c) 片电导率与栅电压的关系。此处,栅电压 VG 以 1 mV s⁻¹ 的速度扫描。箭头指示了栅电压扫描的方向

d) 转移曲线测量中的栅漏电流

e) 片电导率 G 随时间变化的曲线,负栅电压序列(−0.6、−1.2、−1.8、−2.0 V)每次脉冲间隔 6 分钟,正栅电压序列(2.0、1.8、1.2、0.6 V)每次脉冲间隔 6 分钟。源-漏电压 VSD = 0.6 V

为了展示突触功能所需的多级状态,电解质栅控的SFO晶体管通过向栅极发送一系列电压脉冲进行操作(图2e)。这些脉冲序列包括“写入”操作,即一系列VG脉冲施加到栅极。在脉冲序列期间,通道电导率在“读取”操作中以VSD = 0.6 V进行测量。与大多数突触晶体管相比,SFO基突触晶体管的电导率(≈5 nS)非常低(参见支持信息表S1),这种超低电导率对于设计大规模器件阵列的神经网络尤为重要。 最初,BM-SFO通道在零偏压下保持200秒电导率恒定,从而排除VG = 0时化学反应的影响。在负电压脉冲序列作用下,通道电导率从5 nS逐步增加至12 nS。在每次负“写入”操作期间,通道电导率由于SFO通道从绝缘BM相向导电PV相的相变而增加。更高的VG值会引起更大的通道导电调制。通道电导率在每次“写入”操作后可保持不变,表明具有固有的非易失性行为。这种非易失性源于结构相的稳定性,对于实现低能耗的神经形态器件至关重要。基于绝缘BM和金属PV混合相的不同比例,这些电压控制的多级状态得以形成。施加负VG可增加通道电导率,而施加正VG则可降低通道电导率(图2e)。该状态可至少稳定保持2×104秒,表现出良好的保持特性(参见支持信息图S8)。值得注意的是,通过拓扑相变诱导的PV-SFO薄膜在一年后仍然保持稳定。良好的保持特性对于离线训练的人工神经网络尤为重要。随后的一组正VG脉冲将器件电导率恢复至初始状态。具有VG控制的多级导电状态的电解质栅控铁氧体晶体管为设计突触器件提供了独特机会。

利用电压控制的多级导电状态,我们展示了电解质栅控铁氧体晶体管能够表现出神经形态器件的突触功能,这些功能是神经形态设备的构建基础。激发兴奋性突触后电流(EPSC)是神经元传输的主要过程的关键特征。为评估SFO晶体管中的突触响应,我们向栅极施加了一系列不同偏置幅度的突触前脉冲,并在VSD = 0.6 V的条件下同时监测源-漏电流(ISD)。脉冲宽度固定为5秒。显然,突触前脉冲(VG)在SFO通道中触发了突触后电流(ISD)(图3a),且EPSC可以通过改变VG脉冲幅度来调节。短期记忆到长期记忆的过渡利用了静电和电化学效应,并随VG的增加而发生(图3a)。在这里,我们主要利用SFO薄膜的拓扑相变来模拟生物突触的长期现象。 此外,EPSC可以通过改变突触前脉冲的脉冲宽度来调节。施加的栅极脉冲幅度固定为-2 V。随着脉冲宽度的增加,栅极脉冲触发的EPSC峰值和保持值增加(图3b)。图3c显示,通过向电解质栅控SFO晶体管发送交替的负向和正向栅极脉冲,可以控制双稳导电状态。施加16个-1.8 V的负向VG脉冲将电导率从4.8 nS增加到7.8 nS。接着,使用24个幅度为+1.8 V、脉冲宽度为10秒的VG脉冲,将导电状态逐步降低,电导率最终从7.8 nS减少到4.8 nS。重复这些测量的循环表明非易失性存储行为完全可复现,并在第一次循环中重复了VG的过程。

图 3. 用于神经形态计算的铁氧体突触晶体管特性

a) 一系列栅电压脉冲(脉冲宽度为 5 秒)和不同电压幅值(−0.6、−1.0、−1.4 和 −1.8 V)引起的EPSC

b) 一系列栅电压脉冲(幅值为 −2.0 V)和不同脉冲宽度(10、20、30、40 和 60 秒)引起的EPSC

c) 通过应用两次栅电压脉冲(−1.8 V 和 1.8 V)对片电导率进行调节,并测试在零偏压下的保持性能。使用了 16 次 −1.8 V 脉冲和 24 次 1.8 V 脉冲。脉冲宽度为 5 秒,脉冲间隔为 10 秒

d) VG 控制的长期增强和抑制行为,使用了 16 次负脉冲(−1.8 V,5 秒,间隔 10 秒)和 24 次正脉冲(1.8 V,10 秒,间隔 10 秒)

e,f) 在铁氧体突触晶体管中实现的非对称(e)和对称(f)STDP 功能。这里,Δt 是预神经元脉冲和后神经元脉冲之间的时间差

突触器件应模仿的关键突触属性是突触可塑性,即突触改变其权重的能力【42】。生物突触中普遍存在的长期可塑性包括长期增强(LTP)和长期抑制(LTD),分别定义为突触权重的持续增加和持续减少【43】。这些状态可以通过施加一系列连续的栅极脉冲,借助拓扑相变来调整器件的导电性来实现。LTP被广泛认为是支撑生物系统中学习和记忆的重要基础【44】。图3d展示了LTP作为脉冲数的函数的关系,其中脉冲幅度和宽度固定为-1.8 V和5秒。由于增加的负栅脉冲会有效地增加SFO通道中的氧插层,通道导电性在从绝缘BM-SFO相逐渐向导电PV-SFO相转变的过程中单调增加,从而有效地模拟了生物突触中的LTP行为。 相对地,LTD用于选择性削弱突触,在LTP后阻止进一步编码新信息。当向栅极电极施加正向突触脉冲时,会发生LTD。为演示LTD,我们在突触晶体管中施加了24个连续栅极脉冲,幅度为+1.8 V,脉冲宽度为10秒,间隔为10秒(图3d)。正向栅控倾向于从SFO通道中提取氧离子,导致从金属PV相向绝缘BM相的转变。因此,连续的正向栅极脉冲将减少EPSC。通过施加连续的负向和正向脉冲可以持续地模拟突触权重的增强和抑制,表现出可重复且非易失性的开关行为(图3d)。值得注意的是,为使单次操作中的导电(电导率)更加明显,这里应用了宽的栅极脉冲。LTP和LTD过程也可以通过窄栅极脉冲实现(图S9,支持信息)。每个脉冲的能耗(约4.8 pJ)比基于传统CMOS电路的人工突触(约900 pJ)低几个数量级【5】,与已报道的电解质栅控突触晶体管相当,但高于一些近期的忆阻器报道(表S1,支持信息)。当前的结果表明,SFO器件有望模拟生物突触中发生的突触可塑性。

脉冲时间依赖可塑性(STDP)是模拟突触功能的关键Hebbian学习规则之一,指的是突触权重因突触前后神经元脉冲的时间关联而发生变化【45–47】。突触权重的调节强烈依赖于突触前后脉冲的时间差Δt,从而能够精确控制突触权重变化的符号和幅度。基于电解质栅控SFO晶体管的通道电导率可塑性,我们成功展示了该晶体管具有STDP功能。 为了模拟STDP功能,将多路复用器的输出端连接至晶体管的栅极电极,用于将突触前后脉冲的时间差Δt转换为电压脉冲【25,48】。有关该电路的更多详细信息见图S10(支持信息)。在SFO晶体管中对一系列Δt从-600到600 s进行测试,所得通道电导率百分比变化表明该器件呈现出典型的非对称STDP功能(图3e)。在非对称STDP中,若突触前脉冲先于突触后脉冲到达(Δt > 0),则发生LTP;若突触前脉冲在突触后脉冲之后到达(Δt < 0),则发生LTD。得到的非对称STDP曲线可以拟合为指数衰减函数,模拟了生物突触系统的行为【45】。 通过选择合适的源脉冲形状,还可以实现对称STDP(图3f)。对于对称STDP,通道电导率的变化仅依赖于Δt的绝对值。在基于铁氧体的晶体管中成功实现 STDP 表明该材料系统为开发类脑计算器件提供了新的途径。

为了具体模拟电刺激下的突触增强和抑制过程,将字母 “I”、“O” 和 “P” 写入并从一个 3 × 5 人工突触阵列中擦除(图 4)。首先,将具有低电导率的全新人工突触以阵列形式排列。接着,通过施加 28 个 −1.8 V 栅极脉冲将字母 “I” 写入突触阵列中(图 4a)。脉冲持续时间为 2 秒,脉冲间隔为 4 秒。在脉冲列的作用下,通道电导率从 5 nS 增加到 6.7 nS。字母 “I” 的图像成功地存储在突触阵列中,并且由于拓扑相变的非易失性,该图像可以持续存储一个小时。这一非易失过程展示了这些人工突触如何用于数据存储。 在写入“I”图案后,通过施加虚假脉冲(−0.3 V 振幅,2 s 宽度)测试容错性(图 4b)。突触阵列对写入脉冲敏感,而对虚假脉冲不敏感。施加低偏压的虚假刺激脉冲列后,短期内的电导率增加迅速衰减(图 S11,支持信息)。这种短期现象可以用静电效应来解释【24】。当施加反向脉冲列时,通道电导率可恢复到初始值,且图案 “I” 完全消失,显示了这些人工突触的可擦除性。 为了更直观地展示写入和擦除过程,通过施加增强和抑制脉冲,先后将字母 “I”、“O” 和 “P” 的图像写入突触阵列(图 4c)。颜色等级表示在施加脉冲列后通道电导率的变化。上述实验结果表明,电解质栅控SFO晶体管可模拟生物突触,凸显了该材料系统在类脑计算器件开发中的创新潜力。

图 4. 钡铁氧体突触阵列用于图像记忆

a) 实现为可训练内存的 3 × 5 突触阵列。通过使用 28 次脉冲(幅值 −1.8 V,脉冲持续时间 2 秒,间隔 4 秒),将字母 “I” 图像输入到内存阵列中。这些突触在接下来的一个小时内表现出长期记忆,表明电解质门控产生了稳定的相态

b) 突触内存不受干扰输入(幅值 −0.3 V,15 次脉冲,脉冲持续时间 2 秒)的影响,显示出良好的容错性。随后,通过施加正栅电压脉冲(幅值 1.8 V,22 次脉冲,脉冲持续时间 4 秒),突触阵列“遗忘”输入的图像

c) 字母 “I”、”O” 和 “P” 的图像依次被编程到突触阵列中并从中擦除

我们进一步模拟了人工神经网络的性能,使用实验测得的导电状态(图3d)对两个数据集进行了反向传播训练:一个是“手写数字光学识别”数据集中8×8像素的小图像版本【49】;另一个是“修订版国家标准与技术研究所”(MNIST)数据集中28×28像素的大图像版本【50】。在我们的模拟中,采用了一个简单的三层网络(包含一个隐藏层),使用CrossSim【51】模拟器,如图5a所示。图5b中的示意图显示了一个突触权重层的交叉阵列,这里,交叉阵列作为“神经核心”的一部分,执行矢量-矩阵乘积和外积更新操作【4,52】。 在增强和抑制过程中的累积分布函数绘制在支持信息的图S12中。图5c和5d展示了使用铁氧体突触晶体管训练神经网络的结果,以及理想浮点数神经网络性能的模拟,后者为该算法提供了理论上的极限。对于小数字,分类准确率在第二个训练周期内接近90.6%,在16个训练周期后达到95.2%(图5c)。值得注意的是,对于小数字,理想数值训练的理论极限为96.7%。对于大数字,我们的模拟显示,使用铁氧体突触晶体管的神经网络可以达到92.7%的分类准确率(图5d)。虽然识别准确率略低于一些最近的突触器件【52,53】,但显著高于双端电阻式存储器(20-70%)和相变存储器设备(82.2%)的准确率【54】。 提高识别准确率的关键在于增强和抑制过程的线性和对称性【52】。进一步的材料和器件改进仍然需要,以在这种突触晶体管中达到更高的识别准确率。

图 5. 使用各种设备参数的图像识别模拟

a) 三层神经网络的示意图

b) 显示硬件实现的示意图,其中突触层由电解质门控晶体管交叉条阵列和接入设备组成

c,d) 小数字(c)和大数字(d)在理想设备和铁氧体突触晶体管的训练周期中的准确度演变

综上所述,我们提出了一种新型的三端突触晶体管,采用了SFO这种具备拓扑相变特性的材料。在实验中,通过XRD和STEM测量确认了带有离子液体栅极(ILG)的SFO薄膜在BM和PV相之间的转变。存储状态的切换与SFO薄膜中绝缘BM相和导电PV相之间的切换有关,这归因于通道材料中氧离子的插入和提取。这种三端人工突触能够实现包括突触可塑性和脉冲时序依赖性可塑性(STDP)在内的重要突触功能。基于这些铁氧体突触晶体管构建的人工神经网络在手写数据的分类任务中显示出较高的准确性(95.2%)。拓扑相变具有天然的非易失性、可逆性和稳定性。将先进的拓扑相变材料引入突触晶体管中,有望促进新型高性能神经形态器件的发展。

2.实验部分

样品制备:在 (001) SrTiO₃ 衬底(MTI Ltd.)上,通过脉冲激光沉积(PLD)方法在 308 nm XeCl 准分子激光的作用下外延生长厚度为 50 nm 的褐钙钛矿相 SrFeO₂.₅ 薄膜。激光能量密度约为 2 J cm⁻²,重复频率为 2 Hz。SFO 薄膜在 750 °C 下于流动的氧气气氛中沉积,氧压为 1 × 10⁻³ Pa,并以 30 °C/min 的速率冷却至室温。SFO 薄膜的沉积速率进一步通过 X 射线反射(XRR)进行校准。

器件制备:采用标准光刻技术和氩离子刻蚀将薄膜制成带有共面栅结构的通道,通道尺寸为 210 µm × 50 µm。Pt 层通过电子束蒸发法制备作为电极。为了防止栅电极与源电极之间的电泄漏,使用硬化光刻胶作为隔离层。随后,在氧气气氛下于 250 °C 下退火 5 分钟,以增强电极接触性能。最后,通过滴加离子液体 N,N-二乙基-N-(2-甲氧基乙基)-N-甲基铵双(三氟甲基磺酰基)亚胺于通道和栅电极上完成晶体管器件的制备。

样品表征:使用 Rigaku SmartLab 仪器进行 X 射线衍射测量。在室温空气中使用分光光度计(Agilent 的 Cary 5000 UV–vis–NIR 和 Varian 的 Excalibur 3100)获得光学透射光谱。SFO 薄膜的原子结构采用 JEOL(日本东京)的 ARM-200F 扫描透射电子显微镜在 200 kV 下通过 CEOS Cs 校正器(CEOS GmbH,德国海德堡)来校正探针形成物镜球差进行表征。在接受角为 11–22 mrad 和 90–250 mrad 下采集高角环形暗场(HAADF)图像。电子能量损失光谱实验使用与透射电子显微镜附带的 Gatan 光谱仪在 STEM 模式下于 200 kV 下进行。

电学测量:在 Lakeshore 探针台中,使用 Keithley 4200 半导体参数分析仪测量电解质栅控 SFO 器件的电学特性,测量环境为常温。传输曲线的扫描速率约为 1 mV/s。温度依赖电阻(t-R)的测量也是使用 Keithley 4200 半导体参数分析仪在 Lakeshore 探针台中进行的。