摘要:人类非组蛋白赖氨酸巴豆酰化位点在生物学活动中发挥至关重要的作用。然而传统湿实验耗时耗力,使得计算预测方法在近年来备受欢迎。尽管赖氨酸巴豆酰化位点具有重要的生物学意义,但针对人类非组蛋白的相关研究较少。本文构建了一个残差金字塔网络(residual neural network, RsFPN),开发名为iHNHC-RsFPN的集成深度学习预测器。首先,采用3种特征提取方法从样本中提取特征;其次,针对不同特征类型分别构建基于RsFPN训练的弱分类器;最后,整合3个弱分类器构建最终的强分类器。独立测试集结果显示,iHNHC-RsFPN的灵敏性(Sn=0.8580)、特异性(Sp=0.7463)、准确性(Acc=0.7798)和马修斯相关系数(MCC=0.5586)等4个指标均表现优异。研究结果表明,与现有的预测器相比,iHNHC-RsFPN在人类非组蛋白巴豆酰化位点的预测精度上有了显著改进。此外,本文还创建了一个用户友好的网络服务器(http://www.lzzzlab.top/ihnc/),它无需复杂的公式计算,可直接为相关专家学者提供预测服务,助力其进一步研究。
文章目录
1 材料与方法
1.1基准数据集的构建
1.2 提取特征方法
1.2.1 AAindex数据库
1.2.2 ZScale 方法
1.2.3 蛋白质大语言模型
1.3 深度学习算法
1.3.1 DNN结构
1.3.2 模型训练策略
1.3.3 模型集成策略
1.4 评价指标
2 结果
2.1 不同的特征编码对模型预测性能的影响
2.2 集成学习算法的优越性
2.3 消融实验的比较
2.4 iHNHC-RsFPN是最佳的非平衡赖氨酸酰化位点预测模型
2.5 iHNHC-RsFPN与其他非组蛋白巴豆酰化位点数据集中模型的比较
2.6 服务器预测网站
3 讨论