您的位置:首页→DB scoring

Database searching scoring

LDF score
在PEAKS DB中,对于得分的计算,可以通过下图说明。

在PEAKS DB内部,是以LDF(线性判别函数)score来评价肽谱匹配的质量的。LDF score不仅考虑谱图中碎片离子和理论谱峰的匹配情况,还考虑database的肽段和de novo 肽段的一致性。LDF打分系统期望实现的两个目标:1.对于每一张谱图,从序列数据库中找到与各个谱图最吻合的正确多肽序列;2. 对于整个数据集,尽可能区分正确匹配和错误匹配结果。

P-value
为了使得人们便于理解LDF score,讲这一打分转化为P-value。

P-value:对于给定的分数X,P value是指错误匹配得到的分数>X的可能性。可能性小,意味着肽谱匹配是随机匹配的可能性越小。P-value的意义可以通过下图进行解释。

值得注意的是,许多其他软件也会使用同样的术语“P-value”,它们的含义与PEAKS DB中P-value的含义是不同的。其他常见的P-value含义是一个打分大于X的随机的肽段匹配上这个谱图的概率。实际情况一个错误匹配可能来源多很多个随机肽,而不是只有一个随机肽段。因此,在PEAKS DB中的定义更有利于用P-value控制结果质量。

-10logP
将P-value转化为-10log10(P-value)更加易于理解。在PEAKS中,这个值用-10lgP的字符 。通过这个转换,显著的匹配将得到更高的-10lgP的值。另外,当P-value=1%时,-10logP=20。

下图是一个PEAKS DB搜库结果的截图。x轴是-10lgP分数,y轴是在对应的这个分数下,肽谱匹配的数目。通常,一个大于20的分数表示一个较高的置信度(这已经被证明这个阈值以上,在绝大多数目标库中得到匹配,而只有极少数是在反库中得到的匹配)。对于大规模的数据集,推荐使用FDR(假发现率)来选择正确的-10lgP分数阈值(这一点在PEAKS中很容易实现)。然而,当数据集小于100张谱图,或者蛋白数据库中仅包含少量的蛋白时,20是一个适合-10lgP分数阈值。

微信关注
产品与服务
产品中心
技术服务
下载中心
视频下载
资料下载
新闻与活动
活动中心
新闻资讯
关于我们
招贤纳士
合作伙伴
联系我们
备案号:沪ICP备18003966号-1
Tel:+86-21-54155562
Fax:+86-21-60763798
E-mail: sales@wandougu.com
Add:上海市松江区沪松公路 1399 弄 69 号 718
Copyright 2017wandougu. All rights reserved.

用户登录

用户注册