永利电玩城-永利电玩城官方网站-永利电玩城手机版

【永利电玩城,永利电玩城官方网站,永利电玩城手机版】,欢迎来到【LG】娱乐中心,玩你所玩,看你所看,澳门皇冠,太阳集团,澳门太阳赌城,永利402,55402com永利,永利402com,澳门十大赌场,手机网投平台,赌博app官网,永利官网,永利国际,永利皇宫,永利注册,金沙城,金沙官网奥门金沙网址,4166am金沙,我们是一家正规的网上官方平台,自创建以来,以其稳定、安全、快捷和良好的信誉得到了各界同仁的一致认可和好评。期待您的到来!

大数量发生让生物音讯学,高品质总结硬件食神

生物信息学包括很多应用技术,应用的确越来越广泛,能够解决的问题也越来越多,但它还需要结合其他的生物技术。换言之,它的发展离不开生物学的发展,二者是相辅相成的。生物信息学如今最大的变化是效率的提升。以前做生物研究以实验为主,过程很漫长、花费很高,积累的数据量很有限。

原标题:高性能计算硬件比肩国际水平 业内:中国更需要世界级工业软件公司

今年5月,国际顶级学术刊物《自然》在线发表了中国科学院遗传与发育生物学研究所(简称“中科院遗传所”)植物细胞与染色体工程国家重点实验室、遗传发育所基因组分析平台、中国科学院种子创新研究院等合作完成的一项研究论文。该项研究完成了小麦A基因组的测序和染色体序列精细图谱的绘制,对深入研究麦类植物的基因组结构与功能具有重要理论意义和实用价值。

作为底层计算支撑平台,联想公司为中科院遗传所建立的HPC平台扮演着重要的支撑角色,以高性能计算助力科研攻关。那么,在庞大的生物数据计算和分析中,生物信息学需要什么样的计算?对此,《中国科学报》专访了中科院遗传所基因组分析平台首席技术专家、上述论文的通讯作者梁承志。

中科院遗传所博士生导师梁承志 图片来源:采访对象供图

处理三代测序数据有提升

9月14日,中科院遗传所与联想数据中心相关人员在北京举办了一场小型沟通会,希望在高性能计算领域,科研界与产业界能架起更为紧密的桥梁。

《中国科学报》:5月份在《自然》中发表的对小麦A基因组的研究工作中,有部分测序工作除采用了第二代的高通量测序技术外,还采用了第三代的单分子测序技术。在你看来,第三代测序技术对于计算平台提出哪些新的要求?

“我们的日常工作以计算为主,分析生物大数据,没有高性能的计算机群来支撑的话,整个工作没有办法开展。”中科院遗传所博士生导师梁承志如此介绍高性能计算对现代生物信息学研究的重要性。今年五月份,在国际著名学术刊物《Nature》上,梁承志课题组首次揭示了小麦A基因组序列精细图谱,其实验过程中涉及大量的生物数据计算分析。

梁承志:我们开始做小麦基因组测序的时候是2014年,从得出数据到最后发表文章,实际上已经过去两三年的时间,当时我们对小麦基因组测序时仍以二代测序为基础,只利用了一部分单分子测序数据。

联想数据中心中国区方案营销总监李炜表示,中国企业目前基本上可以补全高性能计算机硬件领域所有空白点,无论性能是否足够好,国内已经可以做了。但是在软件领域国内很多地方是空白,中国需要世界级工业软件公司。

三代测序本身错误率比较高,但系统误差小,在测序倍数比较高的时候能够达到比二代还精确的结果,但数据量更大,对计算存储需求就会相应增加。此外,目前技术上对三代测序数据的处理速度都还比较慢,软件功能方面也相对不成熟。

科研少不了自主高性能计算机

在完成小麦A基因组项目的过程中,我们又开发了一些新的生物信息分析技术,利用这些新的软件、新的方法我们就可以用纯三代测序技术来完成小麦基因组的工作了。

HPC是高性能计算机群的简称,是执行一般个人电脑无法处理的大资料量与高速运算的电脑,运算力更为强大的被称之为超级计算机。气候气象、海洋、航空航天、生物、材料、高能物理、药物、生命科学等领域的发展都少不了它,高性能计算机曾为天宫系列卫星路径预测、国产大飞机C919精细数值模拟立下汗马功劳。

目前第三代单分子测序的价格已经降到了我们当时使用的1/10,因此现在做这样一个基因组花费更低,质量比以前高,速度比以前快。这可以看出技术的发展是非常快的,我们在软件分析能力上也有了巨大的提高,但总体来讲还不够,需要更多的提升。

梁承志在接受《每日经济新闻》记者采访时表示,2000年左右生物信息学科开始起步发展,呼唤更多研究人才。加之少年时代对于计算机的强烈兴趣,自己所在的群体遗传的分析又需要最新的方法、技术,最终选择了遗传学和生物信息的交叉领域。

生物信息学将承担更大使命

1995年梁承志于中科院遗传所获得遗传学博士学位,而在2001年,梁承志在加拿大Waterloo大学又获得数学与计算机科学硕士学位。实现了从生物学到计算机科学的跨越,主要研究方向是基因组学和生物信息分析,这也成为梁承志学术生涯最重要的选择之一。梁承志于《Nature》所刊发的文中,绘制了小麦A基因组序列精细图谱,可以加速栽培小麦的遗传改良和分子设计育种。

《中国科学报》:早在几年前就曾有业内人士形容生物信息学像是“在一望无垠的大草原上开车”一样,有很多可做的方向和很大的发展潜力。随着计算力的提升,生物信息学是否迎来了更加黄金的时代?

在研讨会上,梁承志表示,生物大数据有着 “三高”的特征:高复杂性、高不确定性和高维度。这就导致了计算量的复杂,需要高性能计算机集群。如果没有高性能集群支撑的话,对数据的分析是没有办法实现的,因为数据量太大,对存储和计算都有很高的要求。

梁承志:严格来讲,生物信息学是一个技术学科,它涉及到的很多计算理论和方法都是从计算机技术、统计分析这边过来的,以后也会用到人工智能的方法。

“以前我们做生物研究,相对来讲实验为主,做实验过程漫长,花费很高,积累数据量有限。现在实验能力提高了,十年前你要做实验可能要花费一年,现在一个月或者一周,甚至一两天就做完了。” 梁承志指出,现在我们得到了越来越多的数据,通过生物信息学的方法和分析过程,可以产生更多规律性的东西。

生物信息学包括很多应用技术,应用的确越来越广泛,能够解决的问题也越来越多,但它还需要结合其他的生物技术。换言之,它的发展离不开生物学的发展,二者是相辅相成的。

梁承志指出,随着生物信息技术的爆发,高性能计算力的提升更为迫切。其同时指出,科研及其他高精尖技术研发的特殊性决定了安全性上的保证更为重要。

生物信息学如今最大的变化是效率的提升。以前做生物研究以实验为主,过程很漫长、花费很高,积累的数据量很有限。随着实验能力的提高,10年前要花费一年的实验现在一个月甚至一周、一两天就能做完,这种效率的提升所产生的数据需要生物信息学分析,把有用的信息和知识挖掘出来。从这个角度讲,未来生物信息学有可能起到主导作用。

软件应用需发力

《中国科学报》:是否大数据的爆发让生物信息学有了得天独厚的发展机遇?

在中科院遗传所的一处小小的机房所在地,一位科研人员介绍,中科院和联想合建的计算机集群,16年之间在这里不断更换,更新到了现在第四代深腾8810。计算力也从当时的万亿次,提升了千万亿次,提升了千倍。

梁承志:生物信息学的爆发是可以预见的。在大数据时代,生物信息学能够解决的问题也越来越多。首先就是精准医学,涉及到我刚才提到的个人基因组。如果可以测一千万、一亿人的基因组,以及各种组学数据,包括转录组、蛋白组、代谢组、表观组、表型组,再加上食物营养、疾病信息、药物信息等,这种信息或者数据积累的越来越多,生物信息分析起到的作用就越来越大。

第二个重要应用就是分子设计育种。中科院遗传所在这个领域已结出了丰硕的成果,培育出来多个高产优质的水稻新品种。结合生物信息大数据分析,我们可以在未来的分子设计育种中提高目标范围及设计深度,对多个性状进行设计,进一步提高育种的效率。

深腾8810高性能计算机系统 图片来源:采访对象供图

“计算”生物信息仍存瓶颈

回顾历史,我国高性能计算机确实实现了迅猛发展。1983年,我国“银河Ⅰ号”的运算速度达每秒1亿次,同时标志着我国巨型计算机研制成功。2002年8月,联想研制成功了深腾1800超级计算机,实际运算速度超过万亿次。这是中国超算系统首次进入全球TOP500,排名第43位。

《中国科学报》:高性能计算集群在生物信息分析中扮演什么角色?

新华社报道,在2017年新一期的全球超级计算机500强榜单中,中国超算“神威·太湖之光”和“天河二号”连续第四次分列冠亚军。

梁承志:生物大数据除了数据量特别大之外,还有“三高”:高复杂性、高不确定性、高维度。数据维度高就导致了计算量的复杂,这就需要高性能集群。如果没有高性能集群支撑的话,我们对数据的分析是无法实现的,因为数据量太大,对存储和计算都有很高的要求。

不过,“跑”得快、性能好的国产高性能计算机,在实现应用落地上仍需发力。李炜对《每日新闻记者》介绍,性能上我国产品已经足够好,但国产的高性能集群应用领域比较窄,硬件之外,需要软件层面的升级。

《中国科学报》:在做生物信息分析的时候,计算上还存在哪些瓶颈?

在高性能集群最早诞生的时候,最大的技术挑战在于计算能力的损耗。李炜解释,一个计算节点是两万亿次,一百个节点是两百万亿次,但计算的时候不能做到一加一等于二,会有能量的损耗。牛顿的能量转化定律决定了,现实状况下不可能实现理想状态下的能量转化的话,计算力转化就有流失,这就要靠软件。

梁承志:在计算上的瓶颈有很多。生物系统本身特别复杂,是分层次的。一个生命体从个体水平上有各类数据,从组织、器官、细胞水平上也有各类数据,在代谢水平、生化水平上乃至遗传、进化方面都有不同的数据,复杂性特别高。因此,如果计算系统存储硬件不够的话,计算效率就会大大降低。在做分析时既要考虑计算又考虑存储,所以复杂性一下就高多了,这是一个基本的需求。

梁承志对生物信息研究领域所面临的瓶颈进行了介绍。其表示,生物数据复杂性的特点使得其对软件的要求越来越高,目前很多软件能力比较弱。市场上现在生物信息的软件比十年前好太多了,但总的来讲,生物信息学分成不同的小的领域,每个小的领域的软件大家都是各做各的,还没有真正的好的融合,这需要一个过程。梁承志这样表达目前所遇到的阻碍,希望在HPC软件应用生态上更为协同完善。

此外,生物数据复杂性的特点使得对软件的需求也越来越高,目前市场上用于生物信息分析的软件比十年前好太多,但总体来讲,仍不够用。

中国有华为、联想等这些大的硬件企业,也有阿里巴巴、百度这样的互联网巨头,现在中国更需要世界级的工业软件公司。李炜指出,联想当时做集群的时候,已经自己开发了集群调优并行软件,特别是数学计算、遗传、物理、气象等领域里有专项团队在做算法开发,努力保证集群效率做到更高。

还有很重要的一点是分析能力还不够,这是未来5~10年急需改变的状况。随着数据越来越多,还需要大量的投入,用以开发新的软件和新的分析方法。其中很重要的一点,随着生物数据的增加,对人工智能技术的需求也会越来越高,在其他领域里已经做得很好的人工智能分析的方法,也可以借过来用。

华金证券在研究报告中指出,从高性能计算机应用机构来看,HPC 应用正在从政府、研究机构转向商用,互联网企业渐渐成为HPC 应用的主战场。这主要得益于人工智能研发对高性能计算需求的增加,随着互联网、工业物联网等新兴负载的出现,有望改变高性能计算软件应用的短板。返回搜狐,查看更多

数据的增加和分析能力的增加有一定的时间差,相对来讲也相辅相成,二者是一个共同发展的过程。

责任编辑:

《中国科学报》:既然生物信息分析计算既要考虑存储又要考虑计算,那么有没有可能通过高性能集群的云化来解决问题?

梁承志:生物信息领域很多,有些分析是云计算能解决的,但是很大一部分分析利用云计算就有点困难。因为要把数据传输到云上,本身就是一件比较困难的事情。

用于生物信息分析的高性能集群,有着非常强的“专用性”。生物数据分析有一定的特殊性,如果用以其他学科的数据分析设计的高性能集群,我们很难做生物数据分析。

本文由永利电玩城发布于关于科技,转载请注明出处:大数量发生让生物音讯学,高品质总结硬件食神

相关阅读