最近加入的商品:

    0 件商品 合计 0

    新闻资讯

    精彩资讯,与您分享

    BiB|南京农业大学人工智能学院计智伟课题组提出蛋白互作预测的语言模型


      7月21日,生物信息领域重要期刊Briefings in Bioinformatics在线发表了南京农业大学人工智能学院计智伟教授课题组的题为“HNSPPI: A Hybrid Computational Model Combing Network and Sequence Information for Predicting Protein-Protein Interaction”的研究论文。在这项工作中,研究人员借鉴了自然语言处理技术,开发了一种轻量级的蛋白质语言模型HNSPPI,用于预测蛋白-蛋白相互作用。

      

    1

     

      HNSPPI通过整合氨基酸序列信息和PPI网络的拓扑特性,综合表征任一蛋白对之间的内在关系(图1)。研究表明,HNSPPI在人类、酿酒酵母、小鼠等六个基准数据集上表现卓越,预测性能明显优于其他五种现有算法(包括DeepFE-PPI、DeepPurpose等)。最后,HNSPPI模型被用于探索SARS-CoV-2-Human相互作用系统,推理出3个与病毒蛋白S或M有潜在互作关系的宿主蛋白。总之,HNSPPI是一种很有前途的AI模型,可用于鉴定病毒/病原菌入侵宿主后的靶向结合蛋白。

      

    1

     

      图1. HNSPPI模型计算流程图。

      研究人员首先开展消融实验,证明了特征融合策略的重要性。他们测试了HNSPPI集成模型、仅用Net2vec模块、仅用Seq2vec模块在六个公共数据集上的预测性能。从图2可见,HNSPPI集成模型在人类、酿酒酵母、黑腹果蝇、幽门螺杆菌等四个PPI数据集上的性能显著优于仅使用Net2vec模块或Seq2vec模块的预测模型。

      

    1

     

      图2. HNSPPI模型在六个公共数据集上的消融实验

      进一步,研究人员在所有六个基准数据集上将HNSPPI模型与其他5种现有算法进行了性能比较。总体而言,HNSPPI 在所有测试数据集上提供了优异性能。特别地,HNSPPI在酿酒酵母(图3)、黑腹果蝇、幽门螺杆菌等数据集上的表现显著优于其他算法。

      

    1

     

      图3. 所有算法在酿酒酵母PPI数据集上的性能比较

      为了展示该项研究的应用前景和可扩展性,研究者将HNSPPI模型应用于SARS-CoV-2-Human相互作用的复杂系统,并预测了与关键病毒蛋白S或M有潜在互作关系的3个宿主蛋白CCNDBP1, ADAM15, MRPS35(图4A-B)。进一步,他们分析了感染Omicron毒株BA.1和BA.2患者的转录组数据,暗示了这些潜在的相互作用可能与T细胞激活和适应性免疫反应相关(表1)。

      

    1

     

      图4. SARS-CoV-2-Human互作系统的案例研究

      表1. CCNDBP1、ADAM15和MRPS35相互作用蛋白的功能注释

      

    1

     

      综上所述,该研究提出了一种用于PPI预测的新型计算框架 HNSPPI。通过融合蛋白质序列和相互作用网络拓扑的特征信息,HNSPPI提供了跨物种的显著预测性能。与当前五种先进的算法相比,该模型在PPI预测方面实现了卓越的性能提升。与诸多深度学习模型不同的是,HNSPPI提供了轻量级的特征提取策略,并通过简单的分类器即可实现预测。这些优势保证了HNSPPI模型的高可解释性和计算效率。总之,HNSSPPI有望在不久的将来被广泛应用于探索各种病毒-宿主相互作用系统。

      原文链接:https://doi.org/10.1093/bib/bbad261

      图文来源|南京农业大学官网

    相关新闻


    写评价,得奖品

    写评价,得奖励


    更低假阳性概率的蛋白互作研究技术——免疫共沉淀Co-IP

    免疫共沉淀(Co-Immunoprecipitation,Co-IP)是以抗体和抗原之间的专一性作用为基础的用于研究蛋白质相互作用的经典方法,用于确定两种蛋白质在完整细胞内生理性相互作用。与其他蛋白互作研究技术,比如酵母双杂、Pull-down等各有优势,其中Co-IP基于抗原和抗体之间结合,可以从复杂的细胞裂解液中特异性地分离和鉴定蛋白质复合体,对于理解蛋白质如何在细胞内相互作用以及它们如何影响细胞功能和信号传导至关重要。


    Science | 拟南芥ABC转运蛋白ABCB19参与油菜素内酯外排的结构和功能

    油菜素甾醇类激素BR被称为第六大类植物激素。它可以调控植物生长发育,还可以提高植物对干旱、盐碱等环境以及病虫害胁迫的适应性。油菜素甾醇及其人工合成类似物在农业生产中有着广泛应用,可显著提高作物产量和抗逆性。


    关于纳米抗体你知道多少?

    抗体(antibody)是指机体由于抗原的刺激而产生的具有保护作用的蛋白质。它是一种由四条多肽链链接组成的Y型蛋白。 其中两条相对分子质量更大的链为重链,另外两条链则为轻链。每条链有一端为C端,一端为N端,分析抗体四条练链的序列可以发现,在靠近N端的约110个氨基酸序列会存在明显变化,称为可变区,而其他位置的序列则会表现出相对恒定,称为恒定区。


    AI算法“洞悉”蛋白结构,预测蛋白互作

    蛋白质作为生命系统的核心构成要素,蛋白质结构是其功能的决定性因素,一般来说,蛋白质并不是单独发挥作用的,而是通过彼此之间发生相互作用,即蛋白质-蛋白质相互作用(PPI)来完成相应的任务。随着人工智能技术的飞速发展,深度学习和机器学习在蛋白质结构预测及互作预测领域得到了广泛应用。 AI在蛋白质组学领域的应用大致可以分为三个方面:蛋白质结构预测、蛋白质互作预测、蛋白质互作置信度分析。


    酵母分泌信号肽功能验证系统助力信号肽研究

    酵母信号肽筛选系统是一种常用的验证信号肽功能的系统,在这个系统中,通过将含有预测信号肽基因的质粒转入酵母菌中。在信号肽能发挥作用的情况下,报告蛋白将会分泌,可以直观快速的验证信号肽功能。