您的位置:首页→PEAKS SPIDER

SPIDER--序列突变&同源搜索

生物样品中的蛋白质序列通常和数据库中相应的蛋白序列有略微差异,这些差异很多是由蛋白多态性、抗体多样性、数据库误差、跨物种数据库搜索等造成的。序列突变信息的缺失则很可能漏掉潜在的biomarker、抗体确认时引入错误、甚至蛋白质会有较低的覆盖率。对于这些问题,Peaks SPIDER模块设计用于检测序列的突变信息并进行跨物种的同源搜索。

算法原理:


PEAKS SPIDER算法将de novo sequence tag和database protein进行匹配,若相似度显著,算法则通过de novo测序错误和同源肽段序列突变来解释这个差异(Figure1)。更具体说是重建一个”real sequence” 使得正确序列和de novo结果之间的de novo error, 正确序列和数据库蛋白序列的同源多肽突变,这二者的总和最小化。

下图阐述SPIFER如何从一个De novo序列和一条同源肽段重建正确的序列。


为何不用BLAST?

常规的同源搜索工具比如BLAST并不是搜索de novo sequence tags的最佳选择。由于肽段的MS/MS谱中缺失掉一些片段离子导致可能发生从头测序错误的现象是很常见的。因此,对于合适的de novo tag的同源搜索,要有如(AT/TA)和 (N/GG) 这样的测序容错。BLAST出于不同的考虑,会拒绝掉错误太多的情况,可能显著降低了搜索灵敏度。另外,BLAST也不会进行真实肽段序列的重建。

除了明显的突变检测和跨物种搜索功能外,SPIDER另外一个非常有用的应用是可以迭代地使用它来进行一个完整蛋白质的测序(如抗体测序)。通过以下步骤实现:

1.使用Peaks标准workflow (de novo + PEAKS DB + PEAKS PTM + SPIDER)进行同源数据库搜索,可以鉴定同源蛋白质。

2.然后再覆盖窗口中选择工具“copy mutated protein sequence”,这样可以把突变的蛋白质序列(after applying the confident mutations)复制到Windows剪贴板上。

3.通过粘贴复制的序列作为蛋白质数据库调用另一个标准搜索。

4.多次重复以上步骤,逐步提高序列质量。


微信关注
产品与服务
产品中心
技术服务
下载中心
视频下载
资料下载
新闻与活动
活动中心
新闻资讯
关于我们
招贤纳士
合作伙伴
联系我们
备案号:沪ICP备18003966号-1
Tel:+86-21-54155562
Fax:+86-21-60763798
E-mail: sales@wandougu.com
Add:上海市松江区沪松公路 1399 弄 69 号 718
Copyright 2017wandougu. All rights reserved.

用户登录

用户注册