蛋白质建模方法 Modeller 和Swiss model
第一种方法: 最简便的方法,swiss_model建模
材料准备:一段已知的氨基酸序列:(本篇文章采用从modeller的基础教程里的TvLDH)
打开swiss model官网 (https://swissmodel.expasy.org/)
开始:一键建模 Builde Model
图1
下一步:将氨基酸序列粘贴到如下文本框
图2
第三步:点击 Build Model开始建模,swiss model 网站会将你的刚刚复制到文本框的上传到后台,后台建模器会自动选择一个最为相似的蛋白质序列,作为模板进行建模。这个过程大概需要5到10分钟
图3
第四步:得到结果(づ ●─● )づ,嘻嘻
不过大家看红框的地方序列相似度100%,说明这个模型已经被建立过来,而且这个被建立过的模型已经上传的世界蛋白质数据库了,如果你没有特殊的需要,这个模型(如图中4uum)的可靠性非常高了,你就不用再建了,当然这里我们仍然使用这段序列,因为它是modeller官网给的序列,为了方便大家按照modeller官网的教程步调一致。
图4
关于Modeller建模
前言: swiss model建模简单方便,可靠性高,但是它不能进行多模板建模,而且也不能修改其中你想优化的序列片段,那modeller就提供了另一种方法,灵活性高,可进行多模板建模,和序列片段优化,虽然操作相对有些繁琐,不过这对于理解建立蛋白质模型的思路和历程都很有帮助。
本篇教程和其他教程略有不同的地方:
1:采用在Pycharm直接运行脚本文件,而不同于如图5,在Modeller终端运行脚本。
2:在搜索模板的步骤,我们采用了Swiss model搜索模板的方法。
这两种操作都是官网提供的思路,也是modeller建模,脚本运用的灵活之处,也为了大家更方便的学习和操作。
图5
第二种:运用modeller建模
第一步:材料准备
材料准备:一段已知的氨基酸序列:(从modeller的基础教程里找 , 以官网给的TvDHL为例 )注意要修改为 .ali 的格式哦,如 TvLDH.ali ,直接重命名修改后缀名即可。
MSEAAHVLITGAAGQIGYILSHWIASGELYGDRQVYLHLLDIPPAMNRLTALTMELEDCAFPHLAGFVATTDPKA
AFKDIDCAFLVASMPLKPGQVRADLISSNSVIFKNTGEYLSKWAKPSVKVLVIGNPDNTNCEIAMLHAKNLKPEN
FSSLSMLDQNRAYYEVASKLGVDVKDVHDIIVWGNHGESMVADLTQATFTKEGKTQKVVDVLDHDYVFDTFFKKI
GHRAWDILEHRGFTSAASPTKAAIQHMKAWLFGTAPGEVLSMGIPVPEGNPYGIKPGVVFSFPCNVDKEGKIHVV
EGFKVNDWLREKLDFTEKDLFHEKEIALNHLAQGG
第二步:搜索模板
运行:搜寻模板:在Modeller通过用build_profile.py和compare.py两个python脚本,来筛选与目标序列相似的模板。耗时较长,而且对比的数据库pdb_95.pir有限,在这里我们采用swiss model网站的搜寻模板功能
图6
结果:找到模板,为了和官网教程保持一致,这里还是按照官网给的1bdmA模板
第三步:模板与目标序列对齐
运行:用align2d.py脚本使目标序列这里用的是TvDHL和模板对齐,模板用.pdb格式
结果:生成TvLDH-1bdmA.pap文件
第四步:建立模型
运行:用model-single.py进行建模
结果:TvLDH.B99990001.pdb
TvLDH.B99990002.pdb
TvLDH.B99990003.pdb
TvLDH.B99990004.pdb
TvLDH.B99990005.pdb
注意:可以根据自己的需要选择要建模的个数,同时建模个数越多,耗时也越长,但是建出好模型的概率也会越大。
筛选最优建模结果:从model-single.log筛选最优的模板,一般看molpdf分数最低的。
第五步:评测画图
运行:用evaluate_model.py脚本对建立的蛋白质模型进行评测
结果:得到TvLDH.profile文件
用gnuplot或者 plot_profiles.py画图
那在这里我们直接用 plot_profiles.py画图了, plot_profiles.py在官网给的basic example文件里有。
当然如果你习惯用gunplot软件画图,也可以达到同样的效果。如果你没有这个软件的话,这里提供一个下载链接https://jaist.dl.sourceforge.net/project/gnuplot/gnuplot/5.4.3/gp543-win64-mingw.exe。使用命令行语句,‘plot “TvLDH.profile” using 1:42 with lines’
我们这里采用plot_profiles.py
图7
这个pylab模块在Matplotlib库下,所以要提前安装Matplotlib 在终端Terminal 执行命令 pip install matplotlib即可
图8
在这里要注意一个事项,evaluate.py第一次运行一次,那么我只能得到一个画图的数据文件TvLDH.profile,但是我们还需要模板Template所用的数据,也就是图中的绿线(Template)所用的数据,所以我们需要修改一下evaluate.py脚本,把下图中圈红线的修改一下,运行一下evaluate.py得到画模板线的数据1bdmA.profile文件。
如果大家有Python基础的话,理解起来还是很简单的,当然对这些脚本的简单理解和修改,也能很好的帮助大家理解modeller建模过程,如果大家感兴趣的话,Ctrl+左键,可以直接查看一些方法的源代码,进一步了解建模所运用的数学算法,如果不了解Python的话也没关系啦,按照我介绍的步骤也能得到结果,同时我也会上传一些步骤视频。
图9
修改为下图:
图10
最后一步:运行plot_profiles.py,生成dope_profile.png如下图,学会制作这个图很重要哦,接下来的多模板建模还要用到画图。
加油,各位!
写的不好的地方,多多见谅(づ ●─● )づ,有什么疑问的地方,欢迎评论留言,别忘了点赞哦
图11 作者:阿修的学习记录分享 更多视频教程,请访问我哔哩哔哩的主页:modeller建模
https://www.bilibili.com/read/cv15016935 出处: