*Gate-Tunable Anisotropic Oxygen Ion Migration in SrCoOx: Toward Emerging Oxide-Based Artificial Synapses

(门控可调各向异性氧离子迁移在SrCoOx中的应用:迈向新兴的基于氧化物的人工突触)

主题:

  离子液体(IL)的栅极控制极化产生的超高电场可以操纵的氧离子注入和萃取,实现离子液体门控的氧离子迁移,以实现绝缘态 SrCoO₂.₅(BM-SCO) 和金属态 SrCoO₃(P-SCO) 之间的可逆相变,还探索包括电场和浓度梯度在离子迁移中的作用,以及氧骨架对离子液体门控效应的影响。 并发现离子迁移高度依赖晶体方向,尤其是沿 [110] 方向,能实现快速氧离子传输通道。

实现装置:

  用通过离子迁移操作的三端电解质晶体管模拟生物神经元和突触连接,栅电极被视为突触前终端,用于施加尖峰脉冲;沟道层相当于突触后膜,其电导率可被栅极电压(尖峰脉冲)改变。

实验结论:

BM-SCO 中不同晶向对电导率的调制

  • 在 (001) 和 (011) SrTiO₃ (STO) 基底上沉积了厚度为 40 nm 的外延 BM-SCO 薄膜,以BM-SCO 为沟道材料,作了一系列双沟道电解质晶体管器件,所谓双沟道,即通道 I:是直接与离子液体接触的通道,因此受到离子液体门控效应的影响,其电导率可以被门电压(Vg)调制。通道 II:是不与离子液体接触的通道,因此其电导率不受离子液体门控效应的直接影响,但可以通过通道 I 中的氧离子浓度梯度间接受到影响。
  • σ₁:代表通道 I 的电导率,即直接位于离子液体(IL)下方的通道的电导率。σ₂:代表通道 II 的电导率,即没有被离子液体覆盖的通道的电导率。σ₁[100] 和 σ₂[100] 则是指这些通道沿着[100]方向的电导率,同理,σ₁[110] 和 σ₂[110]则是指这些通道沿着[110]方向的电导率。
  • (001)BM-SCO:表示BM-SCO(SrCoO2.5)薄膜在晶体生长过程中,其晶体结构中的(001)平面与基底(substrate)的(001)平面平行。这意味着薄膜的晶体结构沿着基底的[001]方向生长,这个方向通常与基底的晶体结构相匹配,以实现外延生长。(011)BM-SCO:表示BM-SCO薄膜在晶体生长过程中,其晶体结构中的(011)平面与基底的(011)平面平行。这表明薄膜的晶体结构沿着基底的[011]方向生长。
    这些数字代表了晶体的Miller指数,用于描述晶体中原子平面的方向。Miller指数是一组三个整数,用于唯一标识晶体中的一个平面,它们是晶格平面与晶体坐标轴截距的倒数,并且通常取最小的正整数。
  • 实验发现:
    1. 先分析 (001) 和 (011) BM-SCO 中通道 I 沿 [100] 方向的电导率,(001) 和 (011) BM-SCO 的主要区别在于 (001) BM-SCO 的电导率变化所需的阈值电压较低,表明在电场作用下,(001) BM-SCO 中的面内氧离子迁移更容易、更快。
    2. 当 (001) BM-SCO 的两个通道沿 [100] 方向时,即σ₁[100] 和 σ₂[100],发现σ₂ 的变化始终落后于 σ₁。此时通道 I 中 σ₁ 和通道 II 中 σ₂ 的变化均由氧离子的迁移引起,但σ₁是受到 IL/BM-SCO 界面的电场驱动,而σ₂是受到两个通道之间氧离子浓度梯度的驱动。
    3. 当 (001) BM-SCO 的两个通道沿 [110] 方向时,即σ₁[110] 和 σ₂[110],发现σ₁-[110] 和σ₂-[110] 对 Vg 的响应速度都快于 σ₁-[100]和σ₂-[100],且在[110]方向 通道中的 σ₁ 和 σ₂ 的最大差值很小,两者很接近。而在[100]方向 通道中的 σ₁ 和 σ₂ 的最大差值很大。
      σ₂ 对 Vg 的不同响应表明,由浓度梯度驱动的氧离子迁移具有高度的各向异性,且 [110] 方向迁移速度远快于 [100] 方向。

(001) 和 (011) BM-SCO 的晶体结构

  • 通过 (001) BM-SCO 薄膜分别沿 [100] 和 [110] 方向的投影制备了两种 STEM 样品,发现[100] 和 [110] 投影的主要区别在于 [110] 投影的 CoO 亚层中存在周期性的 Co–Co 对,并且氧空位柱位于 Co–Co 配对之间的空隙中。[110] 方向上的 VO 柱可以提供快速的氧离子传输通道。
  • 相比(001) BM-SCO,(011) BM-SCO 的 VO 柱具有平面外分量。由于 BM-SCO 的电导率是在平面内测量的,因此具有平面内 VO 柱的(001)BM-SCO 的电导率比具有平面外倾斜 VO 柱的(011)BM-SCO 的电导率变化更快。 与1.3.1实验发现1结论一致

BM-SCO 人工突触的可塑性

  • 电导率、栅电压以及由 IL 门控引起的电导率变化可以分别看作突触权重、脉冲和突触可塑性。 short-term plasticity(短期可塑性)和long-term plasticities(长期可塑性)是指人工突触模拟生物突触的两种不同的动态响应方式,它们分别对应于生物突触的短期和长期强度变化。这些特性是通过改变突触权重(在本研究中以电导率表示)来实现的,模拟了人脑中学习和记忆的过程。
  • 短期可塑性是指在较小的门电压(Vg)刺激下造成瞬时不稳定的氧离子迁移,BM-SCO人工突触的电导率(突触权重)发生暂时性的改变。这种改变是可逆的,即在移除刺激后,电导率会恢复到原始状态。
    在文献中,短期可塑性通过应用较小幅度的负Vg脉冲(对于 (001) BM-SCO的σ₁-[100],例如-0.5 V和-1 V)来实现,这些脉冲引起的电导率变化在脉冲结束后会迅速衰减回初始状态,表现为电导率的瞬时增加和随后的快速下降。
  • 长期可塑性是指在较大的门电压刺激下造成永久性氧离子迁移,BM-SCO人工突触的电导率发生持久性的改变。这种改变是非挥发性的,即在移除刺激后,电导率的增加或减少可以长时间保持,模拟了长期记忆的形成。
    在文献中,长期可塑性通过应用较大幅度的负Vg脉冲(对于 (001) BM-SCO的σ₁-[100],例如-1.5 V、-1.7 V和-2 V)来实现,这些脉冲引起的电导率变化在脉冲结束后仍然保持,表现为电导率的持续增加或减少。
  • 这两种可塑性是通过改变门电压的幅度和脉冲间隔来控制的。当脉冲间隔减小时,将可塑性从短期转变为长期,也可增强长期可塑性中的调制效果(负脉冲则电导率增强更多,正脉冲则电导率减少更多。)
  • 在(011) BM-SCO中,增加栅压Vg和缩短脉冲间隔同样会增强σ1-[100],但其长期可塑性所需的Vg阈值相对(001) BM-SCO更高。与1.3.1实验发现1结论一致
  • 基于离子液体(IL)门控效应的可逆性:通过改变栅极电压,可以实现对材料电导率的增加或减少,并且在移除电压后,材料的电导率可以恢复到原始状态。
    当在离子液体门控晶体管中施加负栅极电压时,氧离子会从离子液体注入到BM-SCO薄膜中,导致电导率增加。相反,当施加正栅极电压时,氧离子会从BM-SCO薄膜中提取出来,导致电导率减少。
    这种电导率的变化是可逆的,即在移除栅极电压后,BM-SCO薄膜的电导率可以恢复到未施加电压时的状态。
    离子液体门控效应的这种可逆过程对应BM-SCO薄膜的相变,如从绝缘的brownmillerite相(SrCoO2.5)到金属的perovskite相(SrCoO3)的转变。

基于长期增强和长期抑制的手写数字识别模拟

  • LTP和LTD具有“良好的线性开关特性”意味着电导率的变化与施加的栅极电压(Vg)之间存在线性关系,即电导率的增加或减少与电压变化成比例。这种线性关系对于实现精确的突触权重调制至关重要。
    非线性因子是用来量化LTP和LTD过程中电导率变化的非线性程度的参数。非线性因子越接近1,表示电导率变化越接近线性。非线性因子是一个量化线性程度的指标,非线性因子较低表示电导率变化与输入信号之间的关系更接近于直线,这是一个理想的特性,因为它允许更精确和可预测的突触权重调整。
  • 实验发现, BM-SCO人工突触的LTP和LTD的非线性因子分别为0.70和0.81,整体上低于(001) BM-SCO人工突触的0.60(LTP)和1.29(LTD),因此导致了相对较高的识别精度。

基于各向异性权重调制的平面内 (001) BM-SCO突触的多样性

  • 沿[100]和[110]方向分别制造了两个独立的双通道晶体管,串联的通道I由电场驱动发生氧离子迁移,而通道II由浓度梯度驱动发生氧离子迁移。
    在IL中分解的氧离子首先在负栅电压下注入通道I的表面,从而在垂直方向上形成氧离子浓度梯度,驱动氧离子向薄膜中扩散。即使不再施加栅电压,氧离子通过浓度梯度驱动的扩散长度仍在微米量级。通道I中的较高氧离子浓度也会诱发横向浓度梯度,驱动氧离子向通道II的横向扩散。而当施加正栅电压时,氧离子浓度梯度和扩散方向则正好相反。
  • 当Vg为-0.5V时,电场可能不足以在σ2-[110]和σ2-[100]通道中引起显著的氧离子迁移,因此它们的电导率变化不大。而σ1-[110]通道直接受到电场的影响,因此即使在较低的Vg下也能观察到短期可塑性。
  • 当Vg增加到-1.5V时,电场变得更强,足以在σ1-[110]和σ2-[110]通道中引起显著的氧离子迁移,导致长期可塑性。然而,σ2-[100]通道可能由于晶体取向的不同,氧离子迁移的路径和速率受到影响,因此在同样的Vg下,其电导率变化不如σ2-[110]显著。参见1.3.2,[110] 方向上的 VO 柱可以提供快速的氧离子传输通道。
  • 当Vg进一步增加到-2V时,电场变得更强,足以在所有通道中引起更显著的氧离子迁移。σ1-[110]和σ2-[110]通道各由于电场和浓度梯度的作用,表现出更强的长期可塑性。而对于σ2-[100]通道,尽管其电导率变化不如σ2-[110]显著,但在更强的横向浓度梯度驱动下,也开始表现出短期可塑性。

实验部分

  1. 样品制备:
    高质量的BM-SCO薄膜,厚度约为40纳米,通过脉冲激光沉积法在(001)和(011) SrTiO3 (STO)基底上生长。(使用的是248 nm KrF氪氟激光器。激光的能量密度为1.2 J/cm²)
    BM-SCO薄膜在760°C和5×10^-4 mbar的氧气压力下生长,随后在1×10^-3 mbar的氧气压力下冷却至室温。
  2. 器件结构:
    通过光刻和湿法刻蚀,BM-SCO薄膜被图案化为双通道晶体管结构,通道长度为400微米,宽度为100微米。
    通过磁控溅射技术沉积铂(Pt)和钛(Ti)作为电极。
  3. 门电解质:
    使用离子液体N,N-二乙基-N(2-甲氧基乙基)-N-甲基铵双三氟甲磺酰亚胺(DEME-TFSI)作为栅极电解质。滴加到特定位置,以覆盖栅电极和通道I。
  4. 测量条件:
    所有测量在300K(室温)下进行。
    源-漏极之间的读电压为0.1V。
  5. 电导率测量:
    • 使用Keithley 2400源表以双探针配置测量BM-SCO器件的电导率。
    • 不同的连续或脉冲栅电压通过另一台Keithley 2400源表施加于栅极与漏极之间。
  6. 晶体结构和原子结构表征:
    • 使用原子分辨率的校正STEM(扫描透射电子显微镜)来研究原子结构。
    • 使用X射线衍射和X射线吸收光谱测量来检查薄膜的晶体结构。
  7. 磁性能测量:
    • 使用VersaLab(Quantum Design)测量磁性能。

一些要点

基于BM-SCO(brownmillerite SrCoO2.5)的电解质晶体管来构建人工神经网络:
工作过程:

  1. 输入层到隐藏层的转换:
    • 人工神经网络的输入层包含多个输入神经元,每个神经元对应一个输入值。在硬件实现中,这些输入值是数字图像的像素值。
    • 这些输入值被送入一个BM-SCO基电解质晶体管交叉阵列,该阵列的大小为Xm×Hn,其中Xm是输入神经元的数量,Hn是隐藏神经元的数量。
    • 通过施加“读取脉冲”(read pulses),输入层的每个像素值都会激活对应的晶体管,从而在隐藏层产生Hn个隐藏神经元的输出,这些输出被称为“读取输出”(read output)。
  2. 隐藏层到输出层的转换:
    • 隐藏层的输出随后被送入另一个Hn×10的BM-SCO基电解质晶体管交叉阵列,以产生输出层的神经元值。
    • 这些输出神经元的值范围从0到9,代表图像识别的结果,例如手写数字识别。
  3. 训练过程:
    • 在训练过程中,通过“编程脉冲”(programming pulses),可以修改交叉阵列中晶体管的电导率,从而调整突触权重。
    • 这些权重的调整是基于经典的反向传播算法,使用曼哈顿规则进行硬件训练,以提高识别的准确性。
      原理:
  • 电解质晶体管的门控效应:
    • BM-SCO电解质晶体管的关键在于其门控效应,即通过改变栅极电压(Vg)来控制晶体管的电导率,模拟突触权重的变化。
    • 这种门控效应允许晶体管模拟突触的长时程增强(LTP)和长时程抑制(LTD),即突触权重的长期增加和减少。
  • 向量矩阵乘法:
    • 通过调整每个晶体管的电导率,晶体管交叉阵列可以执行向量矩阵乘法,这是神经网络中前向传播的基本操作。
    • 每个输入向量与突触权重矩阵的乘积产生了隐藏层的输出向量。
  • 硬件训练:
    • 在训练阶段,通过调整栅极电压来改变晶体管的电导率,从而优化突触权重,这是模拟神经网络学习过程的关键。
      一些解释:
  1. 理解“编程脉冲”:
    • “编程脉冲”(programming pulses)是指在人工突触的训练过程中,用于调整突触权重(即晶体管电导率)的一系列电信号。这些脉冲基于学习规则(如反向传播算法)来修改突触权重,以优化网络的性能。
    • 这些脉冲的施加依据是网络的错误信号,即实际输出与期望输出之间的差异。通过这个差异,可以计算出权重调整的方向和幅度,以减少未来的错误。
  2. 理解突触权重:
    • 在人工神经网络中,突触权重代表了输入信号对输出信号的影响程度。在BM-SCO基电解质晶体管交叉阵列中,突触权重通过晶体管的电导率来模拟。电导率较高的晶体管表示较强的连接(较大的权重),而电导率较低的晶体管表示较弱的连接(较小的权重)。
  3. 通过调整每个晶体管的电导率实现向量矩阵乘法:
    • 向量矩阵乘法是神经网络中前向传播的基本操作,它计算输入向量与权重矩阵的乘积以产生输出向量。
    • 在BM-SCO基电解质晶体管交叉阵列中,每个晶体管的电导率对应于权重矩阵中的一个元素。通过调整每个晶体管的电导率,可以实现权重矩阵与输入向量的乘法运算。具体来说,输入信号(如图像的像素值)激活对应的晶体管,产生不同的栅压,而栅极电压控制的电导率决定了信号的强度,从而模拟了权重与输入的乘积。
  4. “读取脉冲”与晶体管数量的关系:
    • “读取脉冲”(read pulses)是指用于从输入层读取信号并激活对应晶体管的电信号。在这种情况下,每个输入信号(如图像的一个像素值)对应一个晶体管,这意味着晶体管的数量与输入层的像素值数量一致。
    • 这种一一对应的关系确保了每个输入信号都能独立地影响网络的输出,从而允许网络处理复杂的输入模式,如图像识别。

全流程:
步骤1:图像输入

  • 输入层:输入数据是手写数字的图像,每个图像被转换成一个数字矩阵,其中每个元素代表一个像素值。
  • 像素值:图像中的每个像素值对应于输入层的一个神经元。

步骤2:输入信号的读取

  • 读取脉冲:为了读取输入信号,对每个输入神经元施加“读取脉冲”(read pulses),这实际上是一系列电信号,用于激活与每个输入像素值相对应的晶体管。
  • 晶体管激活:每个输入信号(像素值)激活对应的晶体管,产生不同栅压,栅压再调控电导率,晶体管的电导率代表了该输入信号的权重。

步骤3:向量-矩阵乘法

  • 突触权重矩阵:输入层的信号通过BM-SCO基电解质晶体管交叉阵列,这个阵列代表了突触权重矩阵。
  • 电导率调整:每个晶体管的电导率被调整以模拟突触权重,这些权重是通过训练过程中的“编程脉冲”(programming pulses)确定的。
  • 信号加权:输入信号(像素值)通过各自的晶体管,根据晶体管的电导率(突触权重)进行加权。

步骤4:隐藏层的计算

  • 隐藏层输出:加权后的信号在隐藏层神经元中进行累加,产生隐藏层的输出,这个过程模拟了神经网络中的前向传播。
  • 非线性激活:在某些情况下,可能还会应用非线性激活函数来引入非线性特性,增强网络的表达能力。

步骤5:输出层的计算

  • 输出层信号传递:隐藏层的输出信号被传递到另一个BM-SCO基电解质晶体管交叉阵列,这个阵列代表了从隐藏层到输出层的突触权重矩阵。
  • 最终输出计算:再次进行向量-矩阵乘法,计算隐藏层输出与输出层权重的乘积,得到最终的输出信号。

步骤6:输出结果

  • 输出层神经元:输出层的神经元数量通常与分类任务的类别数相匹配,例如,手写数字识别可能有10个输出神经元,每个神经元代表一个数字(0到9)。
  • 识别结果:输出层神经元的激活值(电导率)决定了最终的识别结果。通常,具有最高激活值的神经元对应的类别被认为是输入图像的识别结果。

步骤7:训练和优化

  • 误差反馈:在训练阶段,网络的输出与真实标签进行比较,计算误差。
  • 权重更新:基于误差,使用反向传播算法更新突触权重(晶体管电导率),以减少未来的误差。

步骤8:迭代学习

  • 多次迭代:通过多次迭代训练,网络逐渐学习如何准确地识别手写数字,每次迭代都通过调整突触权重来优化网络的性能。

通过上述步骤,基于BM-SCO电解质晶体管交叉阵列的硬件实现神经网络能够从图像输入中学习特征,并最终输出识别结果。这种硬件实现利用了材料的电学特性来模拟神经网络的计算过程,为开发低功耗、高效率的神经形态计算系统提供了新的思路。

PDF展示: