专题导读:高性能计算虚拟数据空间

点击上方蓝字关注我们

高性能计算环境是支撑国家科技创新、经济发展的核心基础设施。目前国家高性能计算环境的总计算能力已突破200 PFlops,总存储容量超过160 PB。但是各节点广域分散,计算与存储资源难以统筹使用。本专题从虚拟数据空间系统构建、分布式系统高效缓存、国家高性能计算环境对虚拟数据空间的运行支撑以及面向非易失内存的MPI-IO接口优化等多个角度出发,探索了构建高性能计算虚拟数据空间的过程中面临的机遇和挑战以及相应的解决方案,希望能够引起广大读者的兴趣,并起到抛砖引玉的作用。

秦广军等人撰写的《面向国家高性能计算环境的虚拟数据空间系统》建立了一套可用于构建广域全局虚拟数据空间的完整技术体系,并研发了一个可运行于国家高性能计算环境的虚拟数据空间软件系统。该系统在国家高性能计算环境中进行了实验性部署,通过3类典型大型应用的验证结果表明,该系统可有效地聚合广域分散存储资源,满足大型应用的数据空间需求。

肖利民等人撰写的《GVDS:面向广域高性能计算环境的虚拟数据空间》提出了虚拟数据空间构建方法及数据访问性能优化方法,并实现了一个面向广域高性能计算环境的全局虚拟数据空间GVDS。测试结果表明,与当时最优的面向广域高性能计算环境的存储系统相比,GVDS在实现了相当功能的同时,数据访问性能明显提升。

杨青霖等人撰写的《分布式存储系统中的数据高效缓存方法》针对典型分布式存储系统存在的写放大、I/O路径过长、响应时延较高等问题,提出了一种基于SSD的分布式存储系统中的数据高效缓存方法。该方法采用读写旁路和懒惰缓存的缓存管理策略、兼顾最近访问时间和历史访问频率的缓存替换策略,并自适应地调整主动回刷脏数据的速率,从而显著提升了存储系统的读写性能。

牛北方等人撰写的《国家高性能计算环境的虚拟数据空间运行支撑技术研究》研究了国家高性能环境节点部署技术。该技术通过模块化方式将虚拟数据空间系统与国家高性能计算环境进行深度融合,将其功能补充到国家高性能计算环境中,并通过统一的虚实空间用户管理框架,实现跨域统一、透明安全的存储服务和对大型计算应用的支撑。

邓镇龙等人撰写的《面向非易失内存的MPI-IO接口优化》针对非易失内存对MPI-IO接口进行了优化,从分布式缓存、持久性元数据以及进程间数据传输策略三方面着手,使应用可以被有效管理,利用非易失内存设备保持缓存数据的一致性。实验结果证明,优化后的接口为应用带来了数十倍的读写性能提升。

由于篇幅有限,本专题无法涵盖高性能计算虚拟数据空间建设的各个核心方法和关键技术,希望本专题收录的研究和探索能够引起学术界和工业界的关注,共同推动国家高性能计算环境的完善和发展。

作者简介

张广艳(1976-),男,博士,清华大学计算机系长聘副教授、博士生导师,主要从事大数据存储与分析的理论和方法研究,包括大数据计算、存储系统与分布式处理等方面。研究得到了国家杰出青年科学基金项目、国家重点研发计划项目、国家973项目和国家863项目等的支持。近年来提出了大规模存储系统构建及访问的方法与关键技术,有效提高了存储系统的性能、扩展性和可用性。发表学术论文40余篇,其中在FAST、USENIXATC、ACMTOS、IEEETC、IEEETPDS等计算机系统领域高水平国际会议和期刊发表论文20余篇。近五年以第一发明人获得美国发明专利授权1项、中国发明专利授权7项。

大数据期刊

《大数据(Big Data Research,BDR)》双月刊是由中华人民共和国工业和信息化部主管,人民邮电出版社主办,中国计算机学会大数据专家委员会学术指导,北京信通传媒有限责任公司出版的期刊,已成功入选中文科技核心期刊、中国计算机学会会刊、中国计算机学会推荐中文科技期刊,并被评为2018年国家哲学社会科学文献中心学术期刊数据库“综合性人文社会科学”学科最受欢迎期刊。

关注《大数据》期刊微信公众号,获取更多内容

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值