modeller建模

小小白----

已于 2022-02-27 18:14:15 修改

阅读量3k

点赞数 3

CC 4.0 BY-SA版权

分类专栏： modeller 文章标签： python

于 2022-02-27 11:26:53 首次发布

本文链接：https://blog.csdn.net/weixin_50546483/article/details/123161543

modeller 专栏收录该内容

1 篇文章

订阅专栏

蛋白质建模方法 Modeller 和Swiss model

第一种方法: 最简便的方法,swiss_model建模

材料准备：一段已知的氨基酸序列：（本篇文章采用从modeller的基础教程里的TvLDH）

打开swiss model官网 (https://swissmodel.expasy.org/)

开始：一键建模 Builde Model
请添加图片描述

图1
下一步：将氨基酸序列粘贴到如下文本框

请添加图片描述

图2
第三步：点击 Build Model开始建模，swiss model 网站会将你的刚刚复制到文本框的上传到后台，后台建模器会自动选择一个最为相似的蛋白质序列，作为模板进行建模。这个过程大概需要5到10分钟

请添加图片描述

图3
第四步：得到结果(づ ●─● )づ，嘻嘻

不过大家看红框的地方序列相似度100%，说明这个模型已经被建立过来，而且这个被建立过的模型已经上传的世界蛋白质数据库了，如果你没有特殊的需要，这个模型（如图中4uum）的可靠性非常高了，你就不用再建了，当然这里我们仍然使用这段序列，因为它是modeller官网给的序列，为了方便大家按照modeller官网的教程步调一致。
请添加图片描述

图4
关于Modeller建模

  前言： swiss model建模简单方便，可靠性高，但是它不能进行多模板建模，而且也不能修改其中你想优化的序列片段，那modeller就提供了另一种方法，灵活性高，可进行多模板建模，和序列片段优化，虽然操作相对有些繁琐，不过这对于理解建立蛋白质模型的思路和历程都很有帮助。

本篇教程和其他教程略有不同的地方：

1：采用在Pycharm直接运行脚本文件，而不同于如图5，在Modeller终端运行脚本。

2：在搜索模板的步骤，我们采用了Swiss model搜索模板的方法。

这两种操作都是官网提供的思路，也是modeller建模，脚本运用的灵活之处，也为了大家更方便的学习和操作。

请添加图片描述

图5

第二种：运用modeller建模

  第一步：材料准备

  材料准备：一段已知的氨基酸序列：（从modeller的基础教程里找 , 以官网给的TvDHL为例 ）注意要修改为  .ali  的格式哦，如 TvLDH.ali ，直接重命名修改后缀名即可。

请添加图片描述

MSEAAHVLITGAAGQIGYILSHWIASGELYGDRQVYLHLLDIPPAMNRLTALTMELEDCAFPHLAGFVATTDPKA
AFKDIDCAFLVASMPLKPGQVRADLISSNSVIFKNTGEYLSKWAKPSVKVLVIGNPDNTNCEIAMLHAKNLKPEN
FSSLSMLDQNRAYYEVASKLGVDVKDVHDIIVWGNHGESMVADLTQATFTKEGKTQKVVDVLDHDYVFDTFFKKI
GHRAWDILEHRGFTSAASPTKAAIQHMKAWLFGTAPGEVLSMGIPVPEGNPYGIKPGVVFSFPCNVDKEGKIHVV
EGFKVNDWLREKLDFTEKDLFHEKEIALNHLAQGG

第二步：搜索模板

    运行：搜寻模板：在Modeller通过用build_profile.py和compare.py两个python脚本，来筛选与目标序列相似的模板。耗时较长，而且对比的数据库pdb_95.pir有限，在这里我们采用swiss model网站的搜寻模板功能

图6

 结果：找到模板，为了和官网教程保持一致，这里还是按照官网给的1bdmA模板

第三步：模板与目标序列对齐

运行：用align2d.py脚本使目标序列这里用的是TvDHL和模板对齐，模板用.pdb格式

结果：生成TvLDH-1bdmA.pap文件

第四步：建立模型

运行：用model-single.py进行建模

结果：TvLDH.B99990001.pdb

TvLDH.B99990002.pdb

TvLDH.B99990003.pdb

TvLDH.B99990004.pdb

TvLDH.B99990005.pdb

注意：可以根据自己的需要选择要建模的个数，同时建模个数越多，耗时也越长，但是建出好模型的概率也会越大。

筛选最优建模结果：从model-single.log筛选最优的模板，一般看molpdf分数最低的。

第五步：评测画图

运行：用evaluate_model.py脚本对建立的蛋白质模型进行评测

结果：得到TvLDH.profile文件

用gnuplot或者 plot_profiles.py画图

那在这里我们直接用 plot_profiles.py画图了， plot_profiles.py在官网给的basic example文件里有。

当然如果你习惯用gunplot软件画图，也可以达到同样的效果。如果你没有这个软件的话，这里提供一个下载链接https://jaist.dl.sourceforge.net/project/gnuplot/gnuplot/5.4.3/gp543-win64-mingw.exe。使用命令行语句，‘plot “TvLDH.profile” using 1:42 with lines’

我们这里采用plot_profiles.py

请添加图片描述

图7
这个pylab模块在Matplotlib库下，所以要提前安装Matplotlib 在终端Terminal 执行命令 pip install matplotlib即可

图8

请添加图片描述

在这里要注意一个事项，evaluate.py第一次运行一次，那么我只能得到一个画图的数据文件TvLDH.profile，但是我们还需要模板Template所用的数据，也就是图中的绿线（Template）所用的数据，所以我们需要修改一下evaluate.py脚本，把下图中圈红线的修改一下，运行一下evaluate.py得到画模板线的数据1bdmA.profile文件。

   如果大家有Python基础的话，理解起来还是很简单的，当然对这些脚本的简单理解和修改，也能很好的帮助大家理解modeller建模过程，如果大家感兴趣的话，Ctrl+左键，可以直接查看一些方法的源代码，进一步了解建模所运用的数学算法，如果不了解Python的话也没关系啦，按照我介绍的步骤也能得到结果，同时我也会上传一些步骤视频。

请添加图片描述