作者 / 村口有牛来源/ 巨头财经01.高校算力中心,现在有多火?• 上海交大,峰值算力达6PFLOPS,已支持理、工、生、医的多篇研究,发表于《Science》、《Nature》等高水平期刊上,是目前中国算力最强的高校;
• 清华大学,曾获得国际高性能计算应用领域最高奖“戈登·贝尔”奖;• 南京大学,CPU理论计算峰值达870万亿次/秒,Linpack实测值79.62%除此之外,中南大学、北京大学、江苏大学、南方科技大学、厦门大学、青海大学,等等都已建设自己的算力中心。
高性能计算中心,俨然成为高校科研标配02.为什么火,提高万倍科研效率高性能计算,已经成为继「理论」和「实验」之后,第三大科研手段,也是衡量高校科研实力的重要标志三个例子,足以证明其在科研中的价值• 一个是Meta AI开发的ESMFold,它使用AI代替速度慢、成本高的实验室技术,14天内预测超6亿种蛋白质结构,虽还未完全证实,但已震惊世界;
• 一个是HPC+AI,对油气勘探、储运、炼化、销售等环节进行分析处理,极大降低了全流程成本,仅中石油数据就超过1.6PB;• 上海交大人工智能研究院,通过优化计算AI及HPC应用,将科研效率最高提升1.8万倍。
对于科研从业者来说,这就是颠覆式的行业有一个不成文的共识:基于大算力和AI,未来几十年诞生的新知识,很可能超过历史总和03.国家已经有非常多的算力平台,为啥高校们还热衷自建呢?原因有三个:一是需求全面旺盛,总算力依然不够;二是高校科研对时间要求很高,远程数据调用回传周期太长;三是需要定制化的本地部署,针对多学科主流应用进行效率测试与调优。
这次参访,南大老师们讲得朴素真诚,解开其中的一些道道。04.南大高性能计算中心:三代建设。

南京大学是高校HPC,最早的开拓者和领导者早在1980年,为满足科研需求,建设了第一套HPC系统;2001年和2007年,先后进行系统升级建设;2009年,再次扩建,搭建了以x86架构及刀片服务器为基础一期项目,以34万亿次/秒的性能指标,和92%的Linpack测试效率,成为高校的“超算之王”,一年后,该项目就进入满负荷运行状态;。
2015年,南大决定投入HPC二期建设,通过联想部署了910个CPU计算节点,共计21840个CPU核,理论计算峰值为870万亿次/秒,满足PB级海量数据文件汇存需求目前,是国内高校顶尖的算力中心之一05.
南大高性能计算中心:科研硕果搭建了超30000个算核,承载了2117万次科学计算任务仅在2019-2021年间,就支撑了6篇Nature正刊论文,超百篇学科卓越论文,高质量SCI论文上千篇“南大承担了三十多项国家重大科研项目,高性能计算在学校学科发展中,发挥了不可替代的作用,已经成为名副其实的科研创新基座。
”——南大高性能计算中心副主任周庆林表示06.高校需求特殊,需要服务商共建• 效率第一,尽可能快速算出科研数据结果;• 稳定第二,科研数据珍贵,务必保持连续;• 节能第三,满足前两者下,PUE越低越好;。
• 以满足本校的科研需求为主;• 对各种排行榜没那么关注了;• 不玩概念侧重解决实际问题;• 学校经费相对稀缺,好钢需要用在钢刃上;• 很多高校都在从无到有、从有到精的过程;• 迫切需要有经验的,企业服务商协同建设;
目前,高校的HPC算力中心,基本都是和国内厂商共建完成,包括硬件和软件部分,有经验的HPC服务商,能帮助学校降低成本、减少弯路和浪费、提高科研效能。07.高校算力榜前五,三个背后都是联想。

得益于20多年的深耕积淀,联想是目前最大的高校HPC服务商• 在上海交通大学,联想采用温水水冷技术,打造了“思源一号”绿色水冷高性能计算机群,总计算力6000万亿次/秒,中国高校排名第一,算力超过哈佛、剑桥等,PUE可低至1.1左右,实现42%的节能减排;。
• 南大高性能计算中心二期,六年来,系统运行稳定,故障率小于1%,近三年的CPU利用率大于93%,目前,南大全系统共有33280个CPU核,理论浮点运算峰值1500万亿次;• 北大“未名一号”,由196个联想温水水冷节点组成,理论计算峰值达411万亿次/秒,为数学、力学、物理学、化学、生物学、地球科学、计算机科学等学科,提供了高性能计算环境。
跳出高校,在整个中国HPC市场,联想也是实力最强的,连续11次蝉联全球TOP500榜单份额第一,8次登顶中国TOP100份额榜首,100台集群中有42台由联想制造作为圈外人,了解这些数字后,有点小惊讶的。
08.HOW?联想的「双P战略」。

能获得这么多高校认可,跟联想践行「双P战略」有关,即在降低PUE的同时,提高生产力(Productivity)花了点心思学习,稍微解读一下:① 国外先进的数据中心机房,PUE值通常小于2,我国大多数机房在2-3之间,联想集群采用第五代温水水冷技术,实测PUE 能达到1.09;。
② 通过联想智能超算平台(LiCO)提升管理效率,借助DSS-G提升存储性能,借助HDR/NDR技术提升网络速度另,值得一提的是,联想的高性能计算方案,不仅支持传统的X86架构,还完成了对飞腾、海光等国产生态的支持。
09.HOW?联想的「订阅式服务」高校毕竟不是企业,从项目立项到预算审批,从物理建设到后期维护,从计算调试到科研成果,都是特殊且非标的,需要服务体系的完整配套,不是硬件机房建设那么简单这就要求服务商,要有丰富的建设经验,要充分理解科研需求(数十个院系专业),形成完整的技术服务方案,同时还还要考虑可扩展性、易用性等等。
联想的“订阅式服务”模式,让高校可以按需购买、按量计费,也非常符合高校的经营特点10.这场算力革命,才刚刚开始当前,还有三个大变革契机,每一项都会加速高校HPC的进程• 其一,国家超算互联网平台已进入研发阶段,将破解行业与区域算力分布不均问题;。
• 其二,HPC和AI的融合,AI for Science的出现,让算力价值再上一个台阶;• 其三,过去很多科研成果,都落在实验室和Paper里,离市场转化很远,基于HPC的科研数据,和市场数据天然易于打通,甚至直接转化成市场生产力。
教育部数据,除港澳台地区外,截止到2022年5月,全国高等学校共计3013所,其中849所公办本科,147所“双一流”高校从全盘来看,独立拥有算力中心的比例还不高,证明整个市场依然有巨大的空间种瓜得瓜,种豆得豆,种HPC,十年结果。