CNCC2017中国计算机大会

“智能存储系统及其应用”技术论坛

 

论坛简介:

当前,各种人工智能系统及相关技术层出不穷,如AlphaGoCNNDNN等,其智能性日新月异,现有的新型计算和存储的器件设备,如DiannaoThe Machine、忆阻器等PIM架构,体现了智能处理和存储能力。但是,距离满足上层智能应用和系统在存储方面的需求还有较大的差距,在具体实现上甚至存在供需的不平衡问题。本论坛将讨论类脑计算和深度学习中的存储问题、计算存储一体化的性能瓶颈、3DXPoint的机理和应用、非易失存储的数据组织结构、软件定义存储等存储领域年度热点问题和具有挑战性的技术难点。希望此次论坛深入讨论这些问题,并达成共识,促进我国学术界与工业界在新型智能存储热点技术的研究与发展,提升我国智能存储领域相关方面的国际影响力。

论坛主席

舒继武, 清华大学教授

个人简介:清华大学计算机系教授,国家杰出青年基金获得者,教育部长江学者特聘教授,中国计算机学会信息存储技术专业委员会副主任,灾备技术国家工程实验室副主任。主要研究领域为网络(/云/大数据)存储系统、新型NVM存储系统与技术、存储可靠性与安全、并行/分布式处理技术等,相关成果发表在包括FAST、USENIX ATC、MICRO、ISCA、EuroSys、DAC、DSN、IPDPS、MSST等重要国际学术会议和IEEE/ACM Trans.等权威期刊上,获国家科技进步二等奖和国家发明技术二等奖各一次,部级科技一、二等奖三次。

 

华宇,华中科技大学教授

个人简介:华宇,华中科技大学教授,博士生导师,CCFACMIEEE高级会员,CCFACM杰出演讲者。研究方向是新型存储器件和网络存储系统。主持和参与国家重点研发计划、973863重大专项、国家自然科学基金项目和教育部创新团队等,在USENIX ATCFASTSCSoCCHPDCDATE等学术会议和IEEE TC/TPDS/TIIACM TACOPIEEE等期刊上发表多篇论文。在ASPLOS (ERC)USENIX ATCSOSP (SRC)RTSSICDCSIPDPSDATEMSSTLCTES等会议上担任程序委员,是国际期刊FCSJCN的编委,研究成果获得TST期刊年度最佳论文奖,电子学会信息科学技术二等奖。

 

日程安排:

 时间

              报告题目

  讲者

  单位

13:30- 14:00

Exploring the Usage of Non-Volatile Memories with the Consideration of Memory Hierarchy

 郭大維

台湾大学

14:00-14:30

Bridging the I/O Performance Gap for Big Data Workloads: A New NVDIMM-based Approach

 李涛

佛罗里达大学

14:30-15:00

灰色故障:云系统的阿喀琉斯之踵

 周礼栋

微软亚洲研究院

15:30-16:00

针对大数据应用的基于闪存的存储系统优化

 邵子立

香港理工大学

16:00-16:30

Lightweight Data Compression for Mobile Flash Storage

 薛春

香港城市大学 

16:30-17:00

从记忆载体到智能存储

 华宇

华中科技大学

17:00-17:30

盘古分布式块存储的技术演进之路

 石超

阿里巴巴

 

论坛讲者

个人简介:郭大維教授畢業於國立臺灣大學資訊工程學系 (1986),並於美國德州大學奧斯汀分校電腦科學系取得碩士 (1990) 與博士 (1994) 學位。郭教授現職為國立臺灣大學特聘教授兼學術副校長,曾任中央研究院資訊科技創新研究中心特聘研究員兼主任,台灣大學資訊工程學系系主任與電機資訊學院副院長。郭教授曾任IEEE Real-Time Systems Symposium (RTSS)之TPC Chair (2007) 與 General Chair (2008)。目前擔任國際學術期刊ACM Transactions on Cyber-Physical Systems之Editor-in-Chief,與Journal of Real-Time Systems、ACM TODAES與 IEEE TII之Associate Editor,ACM SIGAPP的Vice Chair與IEEE TC-RTS 的Executive Committee Member。郭教授為ACM Fellow與IEEE Fellow,著有超過250篇已接受於國內外期刊與國際會議之學術論文。郭大維教授曾獲國科會/科技部傑出研究獎、東元獎、2017 Outstanding Technical Achievement and Leadership Awards of the IEEE Technical Committee on Real-Time Systems, the 2017 Distinguished Leadership Award from the IEEE Technical Committee on Cyber-Physical Systems與7次台灣大學教學優良獎與教學傑出獎。

报告题目:Exploring the Usage of Non-Volatile Memories with the Consideration of Memory Hierarchy
 

报告摘要:The replacement of DRAM with non-volatile memory relies on solutions to resolve the wear leveling and slow write problems. Different from the past work in compiler-assisted optimization or joint DRAM-PCM management strategies, we explore a light-weighted software-controlled DRAM cache design for the non-volatile-memory-based main memory. The run-time overheads in the management of the DRAM cache is minimized by utilizing the information from a miss of the translation lookaside buffer or the cache. Experiments were conducted based on well-known benchmarks to evaluate the effectiveness of the proposed design, for which the results are very encouraging.

 

李涛博士是美国佛罗里达大学工程学院电子与计算机工程系教授(首批杰出教授荣誉获得者),智能计算机体系结构设计实验室主任。2004年于美国德克萨斯大学奥斯汀分校获得计算机工程博士学位。2013年获Yahoo!重大研究计划挑战奖。2011年获中国国家自然科学基金海外杰青。2009年获美国国家科学基金会杰出青年教授奖(NSF CAREER Award)。2008年,2007年,2006年均获 IBM 学院奖(IBM Faculty Award)。2008年获得美国微软研究院安全及可扩展多核计算机奖。2006年获得微软研究院可信计算课程研究奖。2012, 2014两度获佛罗里达大学工程学院年度最佳博士生论文导师奖。李涛教授是北美计算机华人学者联合会(ACSIC)创始委员会成员。2012年至2016年入选中国国家自然科学基金委“龙星计划”讲座教授。
在高性能计算机体系结构、 高效/可靠/低功耗微处理器及存储系统、面向云计算和大数据数据中心、虚拟化、并行与分布式计算、新型及可重构计算架构、面向特定应用计算架构、多核容错处理器、片上互连网络、面向多众核的可扩展体系架构、新型前瞻技术及应用对硬件和操作系统的影响、嵌入式与片上系统、以及计算机系统性能评估等诸多领域取得了多项开创性成果。在著名的国际期刊(大部分为 IEEE/ACM 期刊)和计算机体系结构类一级国际会议 ISCA、 MICRO、HPCA、ALPLOS、 SIGMETRICS、 PACT、 DSN发表论文120余篇,同时还获得10多项美国及中国发明专利。其中9篇论文被HPCA’17、ICCD’16、ICPP’15、CGO’14、HPCA’11、DSN’11、MICRO’08、IISWC’07 和 MASCOTS’06会议程序委员会推荐参选“最佳论文奖”。获ICCD’16、HPCA’11最佳论文以及IEEE Computer Architecture Letters 2015年度最佳论文。

报告题目:
Bridging the I/O Performance Gap for Big Data Workloads: A New NVDIMM-based Approach
 

报告摘要:The long I/O latency posts significant challenges for many data-intensive applications, such as the emerging big data workloads. Recently, the NVDIMM (Non-Volatile Dual In-line Memory Module) technologies provide a promising solution to this problem. By employing non-volatile NAND flash memory as storage media and connecting them via DIMM (Dual In- line Memory Module) slots, the NVDIMM devices are exposed to memory bus so the access latencies due to going through I/O controllers can be significantly mitigated. However, placing NVDIMM on the memory bus introduces new challenges. For instance, by mixing I/O and memory traffic, NVDIMM can cause severe performance degradation on memory-intensive applications. Besides, there exists a speed mismatch between fast memory access and slow flash read/write operations. Moreover, garbage collection (GC) in NAND flash may cause up to several millisecond latency.
In this talk, I will present novel, enabling mechanisms that allow NVDIMM to more effectively bridge the I/O performance gap for big data workloads. To address the workload heterogeneity challenge, we develop a scheduling scheme in memory controller to minimize the interference between the native and the I/O-derived memory traffic by exploiting both data access criticality and resource utilization. For NVDIMM controller, several mechanisms are designed to better orchestrate traffic between the memory controller and NAND flash to alleviate the speed discrepancy issue. To mitigate the lengthy GC period, we propose a proactive GC scheme for the NVDIMM controller and flash controller to intelligently synchronize and transfer data involving in forthcoming GC operations. Our experimental results show that overall the proposed techniques yield 10%-35% performance improvements over the state-of-the-art baseline schemes.



 

周礼栋博士,现任微软亚洲研究院副院长并主管微软亚研院/互联网工程院人工智能系统联合中心,主要从事大规模分布式系统、存储系统、无线通讯和网络,以及系统安全和可靠性方面的研究。此前曾任职微软硅谷研究院研究员,微软雷德蒙德研究院主管系统研究的首席研究员和主任研究员, 拥有康奈尔大学计算机科学硕士和博士学位,复旦大学计算机科学学士学位。他是计算机学会计算机存储会刊(ACM Transactions on Storage)编委会成员,曾担任国际计算机系统会议(SOSP, OSDI, NSDI, PODC, ASPLOS, EuroSys, SoCC, 和DISC)的程序委员会成员,第一届亚太系统研讨会 (APSys)的程序委员会联合主席,2017第26届操作系统原理大会(SOSP’17)联合主席。
 

报告题目:灰色故障:云系统的阿喀琉斯之踵
 

报告摘要:大规模存储和计算系统的可靠性是云服务的核心技术,也一直在研究上被认为是已解决的问题:基于Paxos分布式一致性协议的多备份机制,故障自动检测和恢复协议,以及其它基于数据冗余的机制在云存储和计算系统里被广泛采用。在这个报告中,我们结合对微软Azure云服务实际故障的广泛而深入分析,指出传统的系统可靠性理论和基础在云计算这样复杂大系统的时代已经不能胜任。我们提出新的“灰色故障”的概念,希望带动学术界和工业界对大规模云计算存储系统可靠性进行再思考,探寻一套全新、实用的可靠性技术基础、模型、概念和方法论。


 

邵子立,现任香港理工大学计算机系副教授和副系主任。于2005年在德克萨斯大学达拉斯分校计算机科学系获博士学位。当前的研究领域包括嵌入式软件与系统,存储系统和相关工业应用。是国际期刊《IEEE Transactions on Computers》,《IEEE Transactions on CAD》,《ACM Transactions on Design Automation of Electronic Systems》,《ACM Transactions on Cyber-Physical Systems》的副编委,国际会议LCTES-2017的程序委员会主席。


报告题目:针对大数据应用的基于闪存的存储系统优化
 

报告摘要:大数据应用中大量的数据需要存储、传输,存储系统优化因而成为大数据系统中的一个关键问题。此报告将介绍我们最近针对大数据应用的基于NAND闪存存储系统优化的研究。首先介绍通过将存储和应用深度结合来优化基于闪存的键值(key-value)缓存服务器的工作。然后介绍应用非易失性双列直插内存模组(NVDIMM)技术减少大数据负载的I/O延迟所带来的机遇和挑战。


薛春,香港城市大学计算机系副教授,主要研究方向为非易失存储和嵌入式系统。现任ACM TOS, ACM TECS, ACM TCPS 副主编。


报告题目:
Lightweight Data Compression for Mobile Flash Storage
 

报告摘要: Data compression is beneficial to flash storage lifespan. However, because the design of mobile flash storage is highly cost-sensitive, hardware compression becomes a less attractive option. This study investigates the feasibility of data compression on mobile flash storage. It first characterizes data compressibility based on mobile apps, and the analysis shows that write traffic bound for mobile storage volumes is highly compressible. Based on this finding, a lightweight approach is introduced for firmware-based data compression in mobile flash storage. The controller and flash module work in a pipelined fashion to hide the data compression overhead. Together with this pipelined design, the proposed approach selectively compresses incoming data of high compressibility, while leaving data of low compressibility to a compression-aware garbage collector. Experimental results show that our approach greatly reduced the frequency of block erase by 50.5% compared to uncompressed flash storage. Compared to unconditional data compression, our approach improved the write latency by 10.4% at a marginal cost of 4% more block erase operations.


 

华宇,华中科技大学教授,博士生导师,CCF、ACM和IEEE高级会员,CCF和ACM杰出演讲者。研究方向是新型存储器件和网络存储系统。主持和参与国家重点研发计划、973、863重大专项、国家自然科学基金项目和教育部创新团队等,在USENIX ATC、FAST、SC、SoCC、HPDC、DATE等学术会议和IEEE TC/TPDS/TII,ACM TACO,PIEEE等期刊上发表多篇论文。在ASPLOS (ERC)、USENIX ATC、SOSP (SRC)、RTSS、ICDCS、IPDPS、DATE、MSST、LCTES等会议上担任程序委员,是国际期刊FCS和JCN的编委,研究成果获得TST期刊年度最佳论文奖,电子学会信息科学技术二等奖。
 

报告题目:从记忆载体到智能存储
 

报告摘要:以磁盘、光盘和磁带等为代表的传统存储器件主要提供数据记忆的功能,在实际应用中受限于器件材料的属性和访问模式的特征而导致不能高效地支持面向大数据的处理和分析。同时,多种新型存储器件存在原理异构、性能差异和管理复杂等方面的问题,迫切需要通过智能化的存储机制和方法进行系统性的设计和优化。报告将以语义存储为突破口,注重分析当前存储系统在智能化方面所面临的机遇和挑战,并在近似数据处理和智能命名空间等方面进行深入的探讨,以能够显著地提高存储系统的智能性,高效性和可扩展性。


 

石超,高级专家,在阿里巴巴从事分布式存储领域工作,参与多个核心分布式系统的研发,有丰富的工程实践经验。曾经是Apache Crunch项目的维护者(Commiter),向Apache Hadoop和Hbase项目贡献过代码。
 

报告题目:盘古分布式块存储的技术演进之路
 

报告摘要:盘古是阿里巴巴自研的分布式存储系统,被应用在阿里集团的多项关键业务上。基于盘古的块存储系统为阿里云所有虚拟机云盘客户提供稳定可靠的服务。针对新硬件高性能、低延迟的特点,盘古开发了新一代块存储系统。本次报告将会介绍针对新硬件分布式块存储系统设计与实现过程中所遇到的问题、挑战与解决方法。