走向计算架构的下一个十年:超算引发体系革命
5G商用牌照的快速落地,意味着我们正加速走向数据量爆发的新世代。对于计算领域而言,则是要适配更碎片化的复杂需求。
近日举行的2019年国际智能计算机大会上,中国工程院院士李国杰指出,在当前摩尔定律接近失效的阶段,下一个十年将出现全新计算机架构的“寒武纪”大爆发。他甚至呼吁,“未来十年应该有IBM360和RISC一样重大的体系结构发明,中国学者应该做出不愧于时代的贡献。”
现阶段的半导体产业发展确实影响到了算力效果。国家超级计算济南中心主任张云泉向21世纪经济报道记者表示,从近期发布的全球超级计算机TOP500榜单中可以发现,算力增长速度和更新速度都在放慢。这意味着在摩尔定律走向失效过程中,厂商迭代处理器的热情也在放缓。
在云计算、量子计算等新兴技术的推动下,超级计算的演进也将融入更多元厂商的智慧。而底层架构方面,经历过以PC时代英特尔X86的主导、移动时代ARM架构的主导之后,RISC-V被视为有望成为下一个接棒的着力点所在。
产业内生和外部环境变化之下,计算世界正延伸出更大的底层想象力和应用空间。
新技术与超算的交融
在ABC(人工智能、大数据和云计算)等技术快速发展的环境下,超级计算与之也有了更深切的结合点。
李国杰就将超算上升到了“智能超算”的定义,将其理解为面向智能应用的超级计算机。他指出当前超算的能效增长已远低于速度增长,这是产业70年发展中首次出现的情形。“大数据计算的能效已低至20-200 KOPJ,这意味着70年未有之大变局。”他进而指出,目前任何新器件都不可能解决低功耗问题,需要跨层协同。同时,研究智能超算要着眼于“低熵”特征的未来架构,通过全栈的系统设计应对不确定挑战,从而保障可预期的性能和结果。
国家超算深圳中心主任冯圣中在接受采访时也认为,面向AI的超算意味着需要对计算机能效比进一步提升。假如要求手机端通过AI芯片加速器实现能效提升10倍,对于超算则意味着同样成本前提下提高到100倍。“这对超算的系统搭建和应用,意味着机遇与挑战并存。”而从实现路径上看,传统超级计算与云计算其实存在一定程度的路径融合。
在接受21世纪经济报道记者专访时张云泉表示,传统超算中心与新兴互联网企业都有超算需求,在同时支持人工智能、大数据、云计算等技术趋势之下,二者也正在向彼此靠拢。
“目标一样,但路线不大一致。”他续称,从云计算出发支持高性能计算的模式被称为高性能云,是云厂商着力的方向;传统超算则希望从超算角度支持云业务的发展。这导致互联网企业如今也希望参与到传统超算的建设中来,当然目前尚未出现成功案例。
早期超算与云计算曾有一定时期的互斥,这是源于虚拟化后的云计算开销太大,但超算追求的是极致性能。不过随着云计算快速发展,虚拟化的消耗不断降低,甚至一些云厂商已经将其降到可被忽略的程度。
张云泉介绍道,目前业界形成的共识是,用docker容器技术的云计算,进而支持超算发展,其性能和技术发展水平都更为成熟。“今后超算中心会部署容器云,用它来输出超算。”他进一步指出,为了加快产业化进度,超算中心正计划与云厂商联合发布高性能云产品,以期用不同形式把计算能力输送出去。
济南中心的愿景,是打造一个“算力工厂”。希望算力对当地经济发展提供的支持,能类比如今水电这类公共品的支持一样,成为国家大科学装置的聚集高地。
同样将作为基础设施的5G到来,意味着万物互联后带来的爆发性数据量和更多样的数据来源。这是超算发展中不可避免的下一个机会点。
冯圣中告诉21世纪经济报道记者,目前包括电信运营商、通信设备商、AI企业等都在自建机房用于解决内部超算需求,并不是所有超算需求都会负载在中心,但前者会向中心进行相应咨询。而对超算中心而言,5G对大数据处理要求会大幅提升,考验着超算中心如何管理和使用其能力。
这也意味着新应用场景的次第爆发,“对深圳中心来说,今年以来,公安部门、金融机构等都向我们提出了新需求,看如何在5G背景下做相关支持,服务的套餐也会有所不同。”
张云泉则认为,从运算链条上看,5G并不会很快对超算带来很大影响。“5G意味着传输速度更快,文件更细碎,并发度更高。对超算来说,这意味着数据分布方式和处理模型的不同。”张云泉告诉21世纪经济报道记者,不过目前看来,首先冲击的还是端侧处理器的设计,经历过端侧、云端后,才会落到超算这一阶段。
新运算时期的机会
计算领域正面临一系列内生和外部环境变化。从半导体行业本身而言,悲观者认为,在未来5-10年后,摩尔定律就将完全失效。这将是更底层的考验。
张云泉向记者指出,在当前阶段,一味更新处理器未必是好事。“换新后效果差不多甚至更慢,但并行度却更大了,对我们并不是好事。这导致程序编写难度更大,可靠性也会不如从前。”
因此,超算世界还面临着下一个计算平台是什么的问题。在量子计算、生物计算甚至光计算等领域发展的当下,产业也在寻找下一个革命性变化的出处。
面对业界有观点认为量子计算将替代超算,张云泉持否定观点。他指出,归根结底,量子计算也是一个计算工具,可以将之纳入超算体系。
“二者各有优势。量子计算比较擅长解决优化类、并行度高的问题,如最优路径、药物筛选、组合爆炸问题等,但并不适合浮点计算、科学计算。超算和量子计算并不是冲突关系,而可以互补。”他向21世纪经济报道记者解释道,关于新材料领域的探索也在进行,是否能找到延长摩尔定律的条件,目前尚没有确定性答案。
李国杰则指出,模拟计算值得重视。“连续变量的模拟计算是非图灵计算。经过60年的变迁,模拟计算有没有机会东山再起,连续变量与离散变量的混合计算可能会开辟计算新天地。”
不过在底层架构层面,开源指令集架构RISC-V的兴起正在吸引产业界眼球,尤其在目前移动世界ARM架构处于统领地位的情况下。印度就在热烈拥抱RISC-V。
在前述大会期间,致象尔微电子科技创始人方之熙就指出,无论在数据中心、智能手机还是物联网市场,功耗问题越来越严重,这是很难解决的问题。
而近几十年来,微架构创新极少,性能改进不到位;微处理器设计过于依赖于软件生态系统和软件兼容性;安全、隐私和可靠性在微处理器设计中越来越重要;尚且缺乏用于新兴应用的微处理器技术,如AI、大数据、云计算、区块链等。这些都成为RISC-V兴起的背景。
从芯片设计角度来说,RISC-V是比ARM更开放的模式,意味着不再会被大公司一家垄断,而可以鼓励小公司形成小社团。对中国而言,将是一个很好的机会。
芯原股份创始人戴伟民也认为,半导体技术达到了物理极限背景下,数据中心对计算的需求迅猛上涨,诸如深度学习在线预测、直播中的视频转码、HTTPS加密等各类应用对计算的需求已经远超出CPU的处理能力。解决办法就是通过硬件加速,采用异构计算来提升处理性能。而RISC-V的特性正符合人工智能异构计算的发展需要。
“基于RISC-V来发展国产处理器是可以考虑的方向,需要进一步研讨。”张云泉如此表示。