卷积神经网络(CNN)在基因组学中的应用,DNNGP和soyDN

2023-11-19  本文已影响0人  wo_monic

CNN的基本原理和架构

卷积神经网络(Convolutional Neural Network,CNN)是一种深度学习模型,专门用于处理具有网格结构的数据,例如图像和语音。它在计算机视觉领域中得到广泛应用,尤其在图像分类、物体检测和图像生成等任务中表现出色。以下是CNN的基本原理:

文献解读Application of deep learning in genomics

image.png

卷积神经网络在基因组学中的应用。

(1)使用one-hot编码将DNA序列编码为矩阵,作为CNN的输入。所有滤波器(图1B中显示了一个滤波器示例)都是随机初始化的。
(2)在初始化的滤波器基础上,对编码的DNA进行卷积。滤波器通过滑动窗口与相应的输入数据相乘,计算并记录总和(图1C)。滤波器是可调整的参数,通常称为权重,在训练过程中进行修改,以提高模型性能。共享滤波器是CNN的关键思想之一,可减少每层之间的连接数量,从而降低过拟合的风险。
(3)卷积层的输出通过激活函数进行非线性映射。如图1D所示,使用修正线性单元(ReLU)将特征映射中的所有负值截断为零。
(4)基于卷积操作获得的特征映射,进行池化操作以进一步过滤特征映射。一般来说,平均池化和最大池化是两种主要的池化方法,其中最大池化(图1E)被更广泛地使用。池化层夹在卷积层中间,以减少数据维度、参数数量和过拟合的可能性。
(5)由卷积和池化操作组成的多个层叠加在一起,每一层代表比前一层略为抽象的数据形式。经过10到20个卷积和池化层后,添加一个全连接层作为输出层(图1F)。
(6)步骤(1)到(5)说明了训练过程中的前向传递。前向传递输出示例的预测。为提高预测准确性,首先计算预测和标记类别之间的误差(距离)。为了最小化预测误差,使用反向传播计算网络中所有权重的误差梯度。具体而言,随机梯度下降(SGD)通常用于更新所有滤波器,以最小化输出误差。
步骤(2)-(6)对所有输入样本重复进行,直到误差不再减小。然后使用测试数据集评估模型的泛化能力,表明模型是否能够在以前未见过的数据上产生合理的预测。训练好的模型可以用于各种目的,例如增强子、启动子、基因表达、相互作用等的预测器。

DNNGP的原理

soyDNGP的原理

上一篇 下一篇

猜你喜欢

热点阅读