申请试用 咨询/订购
您的位置:首页→PEAKS Online

PEAKS Online——高通量、多用户的蛋白质组学完整解决方案


产品概览


PEAKS Online是一款适应于蛋白质组学大数据时代,能够充分利用服务器计算资源,对大规模质谱数据集提供并行运算,同时可执行复杂算法的软件。不仅在无需安装本地客户端的情况下,为用户提供一个易于使用和便于访问的接口;而且也为用户提供了灵活管理计算资源和共享结果的服务器解决方案。对于PEAKS Online的工作运行而言,为用户提供了一个完整的数据处理工作流的设计思路,从质谱数据获取后,通过PEAKS Online的客户端来管理和进行任务列队,递交给PEAKS Online服务器或者集群进行数据处理和结果整合,最终用户通过Web客户端访问查看、分享分析结果。


软件功能特点


高通量的并行处理系统,支持大队列分析任务

双接口模式,便于用户使用和自动化流程开发

管理员控制和多用户支持

为常规分析建立标准化的工作流程

使用统计图表和多样本蛋白质覆盖率视图方便地比较样本之间的差异

智能化地调用分析结果,随着时间的推移和数据数量的增加,高效地重用结果,而无需全部重新分析

专为大型队列研究设计,对DDA和DIA全面支持,并提供准确地鉴定和定量分析



软件视图介绍


de novo 测序结果可靠性视图

通过网页浏览器登录PEAKS Online,与PEAKS Studio的软件界面类似,当鼠标悬停在肽序列上,在氨基酸水平上看到local confidence打分。每个氨基酸残基也是用不同色彩显示的,很容易地识别出哪些是可信的序列标签。PEAKSlocal confidence score是肽段中每一个氨基酸在这个位置分配的可信度。下图所示用户交互式的谱图注释视图中、可以查看其误差分布和离子匹配表,以供进一步人工评估结果。


便于理解结果的详细可视化界面

PEAKS Online的用户交互界面,能够展示出所有分析层级的信息,从原始数据信息到谱图注释,以及定性定量结果的图表可视化展示。用户可以轻松地对每一个结果节点进行数据过滤,并很快地生成新的数据统计以及相应的可视化图表。通过增加的PEAKS Q模块,可以使用热图、火山图和提取离子色谱图(XIC)来展示结果。


多样本蛋白质鉴定覆盖率比较视图

PEAKS Online在蛋白质的覆盖率视图中,直观地对数据库搜索匹配的肽段和de novo序列标签映射到蛋白质列表中。单击蛋白质覆盖视图中感兴趣的肽,浏览器自动弹出相应的肽谱匹配(PSM)的注释谱图或XIC 。在PEAKS Online X中,对定性结果的蛋白质覆盖视图进行了进一步优化,可以为多个样本的项目在样本基础上映射多肽并加以热图的方式展示。用户可快速估计所有样本的某一肽段的丰度。这里的丰度是以谱图计数的方法来实现的。


向导式参数设置页面

通过workflow向导,用户可以轻松地创建工作流程,并且可以保存并调用。


谱图库搜索结果视图

谱图库查询与结果通过镜像比对,清晰明了地展示碎片离子匹配情况。

谱图库搜索结果也可以切换到二级谱图注释的结果展示方式,同时对于MS1的XIC与碎片离子的XIC进行比较,可以了解碎片离子的母离子归属是否正确,对结果可靠性提供人工检查的可视化证据。

批量导出结果界面

PEAKS Online软件提供一键导出结果列表的批处理界面,用户可以轻松选择需要的结果一键下载。


蛋白质覆盖视图

PEAKS Online提供针对具体样品的蛋白鉴定覆盖视图,可以在该视图下看到和理论数据库完全匹配的多肽和de novo only(与数据库序列相似但不完全一致)的多肽在蛋白序列的覆盖情况。


PEAKS Online架构介绍——专为高通量解决方案


PEKAS Online是一款基于服务器,为多个用户提供并行处理大规模蛋白质组学数据分析的软件平台。Online是一个软件包,包括服务器许可证和客户端许可证,用户可以托管在AWS、阿里云或者腾讯云等,也可以通过同一局域网(本地高性能计算机或集群)来访问PEAKS Online。软件的部署方案使得PEAKS Online可以完全并行化处理数据,易于扩展提高性能。为高通量蛋白质组学的数据分析时代提供了一个理想选择。

PEAKS Online为用户提供了高效和更大规模的既定工作流。我们把用户向服务器发送、递交数据分析的交互式工具称之为PEAKS的客户端,结果的展示类似于PEAKS Studio的展示方式。通过Web客户端界面或者命令行的客户端界面,可以接受多用户同时访问PEAKS Online 服务器,支持分析项目水平和数据水平的并行处理。

双接口模式的PEAKS 客户端

在PEAKS Online的双客户端接口下,易于集成在任何的蛋白质组数据分析工作流中。Web客户端界面提供了一个可视化的交互界面,在此设置和提交项目,并查看和验证结果。命令行(CLI)客户端可集成在现有的工作流水线中,实现自动化地数据处理。

PEAKS功能模块与工作流


PEAKS Online X的设计是对蛋白质组数据采用PEAKS经典工作流的情况下保证精确度和灵敏度分析,同时能够有更高通量的输出。用户可以执行 De Novo Sequencing   , PEAKS DB  , PEAKS PTM   , SPIDER , 和传统PEAKS Studio软件包一样,同样提供了可选功能模块:PEAKS Q  , PEAKS IMS ,通过启用可选模块,可以执行蛋白组相对定量(包括标记和非标记定量)以及离子淌度数据的分析。

PEAKS Online支持从质谱原始数据读取开始的分析工作流。可以通过本地化系统(浏览器或命令行)或者通过访问远程数据存储系统(当数据非本地化存储时)上传数据至PEAKS Online project进行分析。这样,只要在在同一局域网下,可以由任意一台电脑递交数据分析任务,甚至这些客户端不必具有直接访问您的数据文件存储的权限。

一旦数据已上载到PEAKS Online X服务器上,设置PEAKS工作流或从预定义列表中选择。利用PEAKS Online X,用户可以分析工作流,以便实验室中实现一套标准化操作,并建立可以在整个研究小组使用的project特定分析方法。

如果用户需要新加数据到现有的project中,或者改变参数重新跑一次分析,对于PEAKS Online而言,并不需要将全部的工作流全部重新执行一遍。利用PEAKS Online高度并行的计算机技术,可以直接在现有project中对sample进行即时增/删,在保留先前生成的结果信息的同时,仅仅对需要更新的信息进行处理,可以更高效地进行结果再组织。

在分析结果生成后,就可以通过在不同的结果节点的单独导出所需要的结果格式,或者在Export节点一键导出所有结果节点的数据信息。

PEAKS Xpro:全面整合PEAKS Studio和PEAKS Online的功能

PEAKS Studio和PEAKS Online提供类似的解决方案,并在从头测序、数据库搜索、谱图库搜索、PTM、Spider、TMT、SILAC和LFQ共享相同的可靠算法。使用相同的核心功能,能够预见到来自两个产品类似的数据分析解决方案,并可以专注于协调软件,为您的团队提供最佳的计算解决方案和用户体验。


PEAKS Online性能优势


PEAKS Online X使用最新的分布式计算技术来充分利用硬件的计算能力。PEAKS Online X架构是建立在非常流行的Apache Cassandra数据库系统上的。PEAKS Online X使用Akka Actor system实现有效地超高性能的并行计算,特别适合实现高度自愈合的容错系统。这种软件架构方式,在PEAKS Online中可以实现PEAKS Studio不能实现的工作。特别是,PEAKS Online能够适应目前日益增加规模的蛋白质组学数据吞吐量,实现高通量并行计算。此外,它的易扩展、高性能的设置方式,可以通过改变硬件配置随时对吞吐量和性能进行动态调整。如果拥有合适的计算资源,PEAKS Online X可以加快数据处理的速度,至少比PEAKS Studio快10倍,并且可以处理1000个或更多的样品队列。

在最近的一项可扩展性的测试研究中,我们通过增加计算资源来评估PEAKS Online 的可扩展性。测试数据集包含56个样本,每个样本由12个组分组成。总共有672个3小时的MS run,包括500万次MS1扫描和3000万次MS2扫描。使用标准的PEAKS Online X 32线程license,从数据上传、data refinement,de novo sequencing、PEAKS DB、PEAKS PTM和SPIDER到完成该项目大约需要10天的时间。然而,随着CPU内核的增加,性能呈线性增长。在512 核心数的硬件条件下,花了半天多一点就完成了整个分析。


License 信息


PEAKS Online的license是基于服务器计算资源授权和客户端数量授权而设置的。PEAKS Online的基本配置是4个客户端/32逻辑核心或者线程数。研究人员可以增加计算资源授权和/或用户数量,以满足任何研究小组的需求。可以购买PEAKS Online Server性能和客户端的数量来达成数据处理的理想解决方案。

注意,核心数或线程数是针对在PEAKS Online服务器上worker节点可使用的核心数/线程数而言。

用户可以在基本配置的基础上,额外订购客户端的数目和服务器。PEAKS Q和PEAKS IMS模块也可以额外选购。


服务器配置


总的来说,PEAKS Online Xpro由3个组件组成:数据库节点、主节点(Master)和工作节点(Worker)。这些节点可以部署到不同的计算机,也可以部署在同一台机器上。每个组件都有独特的计算资源使用和硬件需求模式。

PEAKS Online Xpro的数据库节点存储所有应用数据,是所有蛋白质组学数据处理的基础。因为PEAKS Online Xpro是一个可以在多台机器上运行的分布式计算框架,所以PEAKS Online使用流行的分布式数据库系统Cassandra作为主要的数据存储来提供大规模的I/O性能。作为Cassandra集群的一部分,每个数据节点都对内存大小和磁盘I/O速度有很高的要求。

Master节点是PEAKS Online Xpro计算框架的核心,它负责计算任务的调度、分派和同步。尽管它不执行任何数据处理,但它负责基于web的用户界面、加载原始数据和导出结果数据,并将从高性能CPU中获得更多好处。


Worker节点负责实际数据的处理和运算。PEAKS Online Xpro易于扩展,所以worker节点可以配置为使用自定义的CPU线程数量。根据经验,每个worker需要2GB可用内存用于每个计算线程,另外还需要2GB备用内存用于自己的使用。除了用于日志记录的几GB硬盘空间需求之外,工作节点通常对硬盘I/O速度和空间没有要求。



注意:如果对服务器配置有任何疑问,请直接联系豆谷以获得技术支持。



微信关注
产品与服务
产品中心
技术服务
下载中心
视频下载
资料下载
新闻与活动
活动中心
新闻资讯
关于我们
招贤纳士
合作伙伴
联系我们
备案号:沪ICP备18003966号-1
Tel:+86-21-54155562
Fax:+86-21-60763798
E-mail: sales@wandougu.com
Add:上海市松江区沪松公路 1399 弄 69 号 718
Copyright 2017wandougu. All rights reserved.

用户登录

用户注册

申请试用

请先登录,再操作!