申请试用 咨询/订购
您的位置:首页→PEAKS Online

PEAKS Online——高通量、多用户的蛋白质组学完整解决方案


产品概览



PEAKS Online是一款适应于蛋白质组学大数据时代,能够充分利用服务器计算资源,对大规模质谱数据集提供并行运算,同时可执行复杂算法的软件。不仅在无需安装本地客户端的情况下,为用户提供一个易于使用和便于访问的接口;而且也为用户提供了灵活管理计算资源和共享结果的服务器解决方案。对于PEAKS Online的工作运行而言,为用户提供了一个完整的数据处理工作流的设计思路,从质谱数据获取后,通过PEAKS Online的客户端来管理和进行任务列队,递交给PEAKS Online服务器或者集群进行数据处理和结果整合,最终用户通过Web客户端访问查看、分享分析结果。

软件功能特点


高通量的并行处理系统,支持大队列分析任务

双接口模式,便于用户使用和自动化流程开发

管理员控制和多用户支持

为常规分析建立标准化的工作流程

通过图表进行数据统计的结果展示




通过网页浏览器登录PEAKS Online,与PEAKS Studio的软件界面类似,当鼠标悬停在肽序列上,在氨基酸水平上看到local confidence打分。每个氨基酸残基也是用不同色彩显示的,很容易地识别出哪些是可信的序列标签。PEAKS的local confidence score是肽段中每一个氨基酸在这个位置分配的可信度。下图所示用户交互式的谱图注释视图中、可以查看其误差分布和离子匹配表,以供进一步人工评估结果。

PEAKS Online的用户交互界面,能够展示出所有分析层级的信息,从原始数据信息到谱图注释,以及定性定量结果的图表可视化展示。用户可以轻松地对每一个结果节点进行数据过滤,并很快地生成新的数据统计以及相应的可视化图表。通过增加的PEAKS Q模块,可以使用热图、火山图和提取离子色谱图(XIC)来展示结果。


PEAKS Online在蛋白质的覆盖率视图中,直观地对数据库搜索匹配的肽段和de novo序列标签映射到蛋白质列表中。在单个样品视图中单击蛋白质覆盖视图中感兴趣的肽,浏览器自动弹出相应的肽谱匹配(PSM)的注释谱图或XIC 。在PEAKS Online X中,对定性结果的蛋白质覆盖视图进行了进一步优化,可以为多个样本的项目在样本基础上映射多肽并加以热图的方式展示。用户可快速估计所有样本的某一肽段的丰度。这里的丰度是以谱图计数的方法来实现的。

PEAKS Online架构介绍——专为高通量解决方案

PEKAS Online是一款基于服务器,为多个用户提供并行处理大规模蛋白质组学数据分析的软件平台。Online是一个软件包,包括服务器许可证和客户端许可证,用户可以托管在AWS、阿里云或者腾讯云等,也可以通过同一局域网(本地高性能计算机或集群)来访问PEAKS Online。软件的部署方案使得PEAKS Online可以完全并行化处理数据,易于扩展提高性能。为高通量蛋白质组学的数据分析时代提供了一个理想选择。

PEAKS Online为用户提供了高效和更大规模的既定工作流。我们把用户向服务器发送、递交数据分析的交互式工具称之为PEAKS的客户端,结果的展示类似于PEAKS Studio的展示方式。通过Web客户端界面或者命令行的客户端界面,可以接受多用户同时访问PEAKS Online 服务器,支持分析项目水平和数据水平的并行处理。

双接口模式的PEAKS 客户端

在PEAKS Online的双客户端接口下,易于集成在任何的蛋白质组数据分析工作流中。Web客户端界面提供了一个可视化的交互界面,在此设置和提交项目,并查看和验证结果。命令行(CLI)客户端可集成在现有的工作流水线中,实现自动化地数据处理。

PEAKS功能模块与工作流

PEAKS Online X的设计是对蛋白质组数据采用PEAKS经典工作流的情况下保证精确度和灵敏度分析,同时能够有更高通量的输出。用户可以执行 De Novo Sequencing   , PEAKS DB  , PEAKS PTM   , SPIDER , 和传统PEAKS Studio软件包一样,同样提供了可选功能模块:PEAKS Q  , PEAKS IMS ,通过启用可选模块,可以执行蛋白组相对定量(包括标记和非标记定量)以及离子淌度数据的分析。

PEAKS Online支持从质谱原始数据读取开始的分析工作流。可以通过本地化系统(浏览器或命令行)或者通过访问远程数据存储系统(当数据非本地化存储时)上传数据至PEAKS Online project进行分析。这样,只要在在同一局域网下,可以由任意一台电脑递交数据分析任务,甚至这些客户端不必具有直接访问您的数据文件存储的权限。

一旦数据已上载到PEAKS Online X服务器上,设置PEAKS工作流或从预定义列表中选择。利用PEAKS Online X,用户可以分析工作流,以便实验室中实现一套标准化操作,并建立可以在整个研究小组使用的project特定分析方法。


如果用户需要新加数据到现有的project中,或者改变参数重新跑一次分析,对于PEAKS Online而言,并不需要将全部的工作流全部重新执行一遍。利用PEAKS Online高度并行的计算机技术,可以直接在现有project中对sample进行即时增/删,在保留先前生成的结果信息的同时,仅仅对需要更新的信息进行处理,可以更高效地进行结果再组织。

在分析结果生成后,就可以通过在不同的结果节点的单独导出所需要的结果格式,或者在Export节点一键导出所有结果节点的数据信息。

PEAKS Online性能优势

PEAKS Online X使用最新的分布式计算技术来充分利用硬件的计算能力。PEAKS Online X架构是建立在非常流行的Apache Cassandra数据库系统上的。PEAKS Online X使用Akka Actor system实现有效地超高性能的并行计算,特别适合实现高度自愈合的容错系统。这种软件架构方式,在PEAKS Online中可以实现PEAKS Studio不能实现的工作。特别是,PEAKS Online能够适应目前日益增加规模的蛋白质组学数据吞吐量,实现高通量并行计算。此外,它的易扩展、高性能的设置方式,可以通过改变硬件配置随时对吞吐量和性能进行动态调整。如果拥有合适的计算资源,PEAKS Online X可以加快数据处理的速度,至少比PEAKS Studio快10倍,并且可以处理1000个或更多的样品队列。

在最近的一项可扩展性的测试研究中,我们通过增加计算资源来评估PEAKS Online 的可扩展性。测试数据集包含56个样本,每个样本由12个组分组成。总共有672个3小时的MS run,包括500万次MS1扫描和3000万次MS2扫描。使用标准的PEAKS Online X 32线程license,从数据上传、data refinement,de novo sequencing、PEAKS DB、PEAKS PTM和SPIDER到完成该项目大约需要10天的时间。然而,随着CPU内核的增加,性能呈线性增长。在512 核心数的硬件条件下,花了半天多一点就完成了整个分析。


License 信息

PEAKS Online的license是基于服务器计算资源授权和客户端数量授权而设置的。PEAKS Online的基本配置是4个客户端/32逻辑核心或者线程数。研究人员可以增加计算资源授权和/或用户数量,以满足任何研究小组的需求。可以购买PEAKS Online Server性能和客户端的数量来达成数据处理的理想解决方案。

注意,核心数或线程数是针对在PEAKS Online服务器上worker节点可使用的核心数/线程数而言。

用户可以下列基本配置的基础上,额外订购客户端的数目和服务器。PEAKS Q和PEAKS IMS模块也可以额外选购。

关于硬件配置和云计算方案建议,请参见PEAKS服务器搭建方案。



微信关注
产品与服务
产品中心
技术服务
下载中心
视频下载
资料下载
新闻与活动
活动中心
新闻资讯
关于我们
招贤纳士
合作伙伴
联系我们
备案号:沪ICP备18003966号-1
Tel:+86-21-54155562
Fax:+86-21-60763798
E-mail: sales@wandougu.com
Add:上海市松江区沪松公路 1399 弄 69 号 718
Copyright 2017wandougu. All rights reserved.

用户登录

用户注册

申请试用

请先登录,再操作!