工程化大脑架构:迈向类人人工智能的探索
立即解锁
发布时间: 2025-08-30 01:07:16 阅读量: 4 订阅数: 6 AIGC 

# 工程化大脑架构:迈向类人人工智能的探索
## 1. 生物合理模型概述
在人工智能的发展历程中,研究者们一直致力于探索更接近生物大脑运行机制的模型,以实现类人水平的人工智能。以下将详细介绍几种生物合理的模型及其特点。
### 1.1 大脑中的反向传播
反向传播最初被认为在生物学上不现实,但随着深度学习的成功,它在模拟大脑皮层计算方面正被重新评估。其关键步骤是下游神经元将校正信息反馈给上游,基于梯度驱动突触权重变化以减少模式匹配误差。
- **随机权重反馈法**:Timothy Lillicrap等人在2014年的研究中表明,通过将误差信号与随机突触“权重”相乘来评估权重校正的简单深度学习算法,能让网络学习并从反馈信号中提取有用信息。该方法证明了神经元利用大脑上游位置产生的误差信号具有生物学合理性。
- **大脑学习(BL)算法**:Yuhang Song等人在2020年提出的BL算法克服了反向传播作为生物现实算法的局限性,满足三个关键要求:产生与反向传播相同的神经权重更新;权重修改是局部的且可并行执行;可修改为完全自主运行。该算法适合在神经形态处理器中实现。
- **树突编码误差模型**:Joao Sacramento等人在2017年提出,反向传播的误差编码在跨区域投射锥体神经元的远端树突上。校正误差源于侧向中间神经元与下游皮质区域的自上而下反馈之间的不匹配,这些误差信号驱动自下而上连接中的突触学习。
- **平衡传播(EP)框架**:由Benjamin Scellier和Yoshua Bengio在2017年引入,用于基于能量的模型,避免了反向传播的一些生物学不合理问题。在EP中,前馈和反馈使用相同的计算电路,通过驱动模型的能量函数到最小值来减少误差。不过,EP模型存在需要网络节点间对称权重的挑战,但Qianli Liao等人的研究表明,反馈权重的大小对性能影响不大,而符号的一致性很重要。
- **模块化学习方法**:Sindy Löwe等人在2020年提出的学习方法克服了反向传播的许多局限性,具有更高的生物学合理性。该方法将深度神经网络拆分为梯度隔离的模块,通过自监督表示学习进行训练,可使用未标记数据集,适用于大规模分布式训练。
### 1.2 强化学习
强化学习(RL)及其与深度学习的结合是Google DeepMind的研究重点。Volodymyr Minh团队在2013年将其应用于Atari游戏取得突破,此后在围棋、国际象棋等领域也有多项进展。
RL是一种无监督学习方法,概念上最接近大脑的工作方式。模型或智能体与环境交互,通过试错发现产生最高奖励的行动。但RL存在奖励稀疏、过拟合、缺乏泛化性和训练过程漫长等挑战,深度RL可通过添加自监督学习来克服部分挑战。
此外,Chrisantha Fernando团队在2018年研究了RL算法中的鲍德温效应,该效应能产生适用于少样本学习的学习算法和模型。
### 1.3 自然选择算法
进化算法和计算是机器学习的标准方法,广泛应用于解决优化问题。这里主要关注它们与大脑认知的关系。
- **神经达尔文主义**:由Gerald Edelman提出,认为自然选择在大脑认知中实时运作,灵感来自免疫学。该理论采用自下而上的方法,通过环境中的强化信号引导认知选择机制。
- **达尔文神经动力学**:Eörs Szathmáry团队构建的认知架构,认为无意识问题解决是一个达尔文过程。该模型通过吸引子网络演化和存储候选解决方案模式,在解决四树问题的计算机实验中表现出潜力。
- **扩展进化综合**:生物学中的“扩展进化综合”考虑了非遗传继承,Sizhe Yuen等人研究了进化计算如何采用这些新的达尔文主义模式,其中表观遗传学可能通过比基因进化更快地传播变化来提高学习率。
### 1.4 生物合理神经网络
- **基于图式的神经网络**:Tiffany Hwu和Jefferey Krichmar在2020年实现的神经网络,通过熟悉度和新奇度过程引入神经调节,有助于在一致图式内快速编码。熟悉度通过模型内侧前额叶皮质中突触权重的持续增强来建模,新奇度则在背侧海马体中通过反赫布学习规则使权重经历长期抑制。该模型为创建具有上下文相关记忆且避免灾难性遗忘的人工智能提供了基础。
- **期望最大化(EM)算法**:由于反向传播使用梯度下降存在生物学不合理性,研究者探索了无需微积分的替代方法,如EM算法。Karl Friston将EM算法应用于最小化亥姆霍兹自由能,提出了大脑行动、感知和学习的自由能原理。该原理认为大脑通过改变自身配置来最小化自由能,Friston团队在2023年的实验验证了该原理在体外大鼠皮
0
0
复制全文
相关推荐









