与非网7月1日讯 RISC-V中国峰会同地论坛在上海科技大学会议中心多功能厅顺利举办。本届研讨会的主题为“新型计算架构与应用驱动的数据存储和管理”,致力于聚焦与新型计算架构和应用相关的数据存储和管理原创性研究、系统应用及生态建设,包括新的系统架构、文件系统、存储器件、存储控制器、系统应用和验证等等。

 

RISC-V是一种开源指令集架构,使用BSD License开源协议,几乎完全免费,其目标是成为指令集架构领域的Linux,与ARM相庭抗礼。在国家的助推下,芯片自主创新研发已是大势所趋。而RISC-V开源架构已得到行业的积极实践与探索,正在成为全球芯片创新的大趋势,基于这项灵活开放的开源芯片技术,国产芯片产业可以有机会和欧美芯片公司在同一条起跑线上竞争,实现我国芯片产业的变道超车。

 

会议邀请了来自学术界和工业界的包括俄亥俄州立大学的张晓东教授、清华大学的陆游游研究员、上海交通大学陈全副教授、UCloud优刻得谢建东工程师以及上海科技大学教授寇煦丰、王春东、范睿和哈亚军参与。与会专家和学者分享了他们目前正在探索的问题和发表的学术成果,激发了同仁和学生们对新型计算架构和应用相关的存储和管理方面的深入思考和探讨。本论坛由上海科技大学和上海市计算机学会存储专委会联合举办,由上海智能视觉影像与应用工程研究中心和上海高能效与智能定制芯片工程技术中心承办,UCloud优刻得给予大力支持。


第一个主旨报告由俄亥俄州立大学的张晓东教授做线上报告,题为Data Managements: Interactions with Computer Architecture and Systems。张教授从计算机架构和系统设计角度阐述数据管理方面面临的技术难点。在摩尔定律和登纳德缩放定律即将完结的时代下,整个计算机架构、算法以及数据管理技术该如何发展?张教授介绍了计算生态系统研发过程中的限制因素,并给出在这个后摩尔时代,计算机生态设计应该关注的技术点。其中包括专用设备加速来保持持续的性能改进;内存和 NVM 存储提供快速数据访问;以内核为中心的管理是不可持续的,必须分散过程控制;需要全面的抽象和自动化工具来实现系统灵活、专业和包容的特性等。


清华大学的陆游游教授,报告题目为持久内存存储系统研究。陆教授介绍了传统存储系统存在的四个问题,包括软件栈开销、操作系统开销、分布式协议栈开销以及请求持久化开销。并针对上述四方面的挑战,陆教授介绍了他们在此问题上所思考的关键技术。首先,在分布式持久性共享内存框架的设计中,针对现有的分布式文件系统存在大量的冗余拷贝问题,通过服务端主动式I/O机制和客户端主动式I/O机制来高效执行I/O操作,从而降低整个软件栈的开销;其次,从用户态和内核态协同文件系统管理的角度来降低操作系统带来的开销。接着,为解决低持久化效率导致系统的吞吐下降问题,分享了网络存储协同批量处理技术。该技术引入持久性操作日志用于存储元数据,从而消除元数据的冗余更新,降低持久化更新次数;通过协同的传输与写回、多核CPU的流水线调度等技术,高效保证分配器的一致性。最后,从分布式协议方面,讲述了引入一致性管理迁移机制,避免交换机无法存储所有的协议元数据;引入崩溃恢复和丢包处理机制,保证系统可靠性。


来自上海交通大学的陈全副教授的报告题目为:面向公有云的高可靠虚拟化存储系统。陈教授深入剖析目前公有云数据存储可靠方面的挑战。介绍本地存储和远程存储过程中分别带来的可靠访问问题。他认为本地存储中主要存在现有故障解决方案造成不必要的数据损失和低可用性,而远程存储主要存在数据一致性风险和故障解决方案的低可用性。通过可靠虚拟化存储系统设计,以高可靠的本地/远程存储访问系统Spool为例,从跨进程生命周期日志、快速启动以及故障诊断和处理等角度,分享了他的科研团队在实际应用过程中所面临的关键问题和解决思路。


UCloud优刻得的资深工程师谢建东报告题为:IPFS 星际存储的挑战和优化。IPFS 是一个全球的、点对点分布式文件存储协议,是服务于 Web 3.0 互联网的存储协议。目标是为了补充或者取代超文本传输协议。谢建东分享了UCloud成立以来所创造的成果。通过工程手段,追求更好的性能;通过运营手段,追求成本和稳定性。深入不同用户场景从而提供最优的存储类型服务。

 

茶歇后来自上海科技大学的四位专家从新型磁存储器件和新型存储管理技术、针对边缘应用的硬件加速方案以及针对数据组织结构的GPU加速方案,从EE和CS的两个角度展现上科大在新型存储和加速架构方面取得的软硬件协同设计优化的研究工作。


寇煦丰教授做题为Emerging Non-Volatile Magnetic Memory Technologies for Data-Driving Computing的报告。寇煦丰教授认为将来的计算瓶颈是数据到逻辑的传输,报告在介绍了各种类型的新兴非易失性磁存储介质的原理和存储技术基础上,着重介绍了上科大后摩尔中心围绕MRAM磁存储器开展的研究进展和突破。


王春东教授报告题为The Tenet of Memory: Following the Prestige,从CS的角度分享了其在非易失内存研究中的新发现,生动形象地介绍如何来降低缓存丢失率,从缓存行管理和查找的角度减少读放大以获得高搜索性能,最后分享课题组针对STT-MRAM的在研工作


范睿教授报告题为A Round Peg in a Square Hole GPU Computing with Irregular Data。他介绍了目前广泛应用的GPU处理器,分析了其优缺点并介绍了如何来提升GPU的性能。范睿认为新的数据结构和算法可实现高GPU性能,对于稀疏问题也是如此,但很多稀疏问题还有待研究,未来可以考虑使用机器学习来协助优化性能。


哈亚军教授的报告题目为TAIT: One-Shot Full-Integer Lightweight DNN Quantization via Tunable Activation Imbalance Transfer。报告从边缘AI等应用场景思考,解决现代神经网络无法有效地部署在边缘设备上等问题。为了解决这个问题,轻量级的DNN是一个不错的选择。轻量级 DNN 采用深度可分离卷积代替传统卷积。传统的卷积融合了水平和垂直方向的信息。相反,深度分离卷积将常规卷积分为深度卷积和像素卷积;另一种选择是对称量化。哈亚军教授分享了他们的研究工作TAIT,提出了一个量化误差模型。 

 

论坛Panel Discussion 思辨环节,邀请到来自上海科技大学硬X射线自由电子激光大科学装置SHINE实验辅助分总体负责人怀平研究员,中科院上海高等研究院感知与计算实验室副主任、SKA项目中国负责人祝永新研究员以及上海科技大学MHPC联合实验室执行主任范海巍高级工程师与几位报告嘉宾一起共议新型计算架构和应用需求下数据存储的挑战和机遇。怀平研究员首先发言,介绍SHINE项目在数据在采集、处理和传输等各阶段的需求,具体表现在数据的TB/s级高通量、多源头数据采集、实时数据降噪结合线下大规模数据分析的多阶段处理模式以及超大规模数据传输等,进而引出大科学装置对数据全周期存储和管理的挑战。


祝永新研究员首先介绍SKA平方公里阵列在天文观测方面的背景知识,进而介绍SKA数据在大规模、高通量基础上具有海量小文件的特征,并结合SKA观测设备全球协作部署和设备部署的恶劣环境展现数据在存储、传输、共享方面的挑战。


范海巍高级工程师则从新型异构计算架构的角度介绍了通用/专用混合计算体系在数据不同器件间加载、交换、处理和存储的特点,分析了传统计算存储架构的局限性,并展望了新型架构下对新型数据存储和管理方法的渴求。


在几位学者从使用者的角度分享了数据在存储和管理方面的角度基础上,主持人邀请上海交大陈全副教授和UCloud技术专家谢建东工程师从云存储系统研究和运营角度分享技术进展和经验,并从数据的可靠性、运营成本、公有云/私有云混合组建等角度进一步分析现有技术的局限性。


思辨环节最后邀请数据存储专家清华大学陆游游教授从学界和企业两个角度分享观点,陆教授首先介绍了近计算存储、存内计算、原位计算等降低数据交换的研究思路,展现优化系统层级对数据存储和管理的促进;然后介绍了针对新型存储设备开展的创新性数据组织管理思路,展现改进文件系统对数据存储和管理的帮助;进而从操作系统层面介绍了内核态和用户态协作优化数据存储的思路。从学术界前沿研究到企业界实践探索,多层次的分析了新型计算架构和应用需求下数据存储的机遇。


思辨环节由上海科技大学信息学院殷树教授主持并作结语:作为RISC-V中国峰会同地论坛,“ASSIST2021--新型计算架构和应用驱动的数据存储和管理”论坛旨在展现新型计算架构浪潮下算力以外的挑战,展现数据存储和管理对计算系统效率和利用率的影响,凸显计算系统软硬件协同设计大趋势下计算/存储协作设计优化的重要性。

 

在RISC-V国际基金会的大力支持下, 由中国科学院软件研究所和 上海科技大学联合主办的RISC-V中国峰会将于2021年6月21日至27日在上海科技大学举办。活动持续一周时间,其中主会将举办三天, 分会场由张飞实战电子、华秋电子和睿思芯科联合主办