当前,我们正在大步迈入“算力时代”。随着整个社会加速数字化转型,尤其是5G、人工智能、大数据、区块链等技术兴起,以及远程医疗、智慧教育、无人驾驶、金融科技等应用加速落地,算力在经济社会发展中扮演愈来愈重要的角色,成为支撑数字经济蓬勃发展的新引擎。不同行业的多样化应用要求不同的数据和算力支持,计算多样性已经成为必然。
随着多样性算力的广泛应用,国内现有算力产品测评和认证体系的不完善,造成了供需双方巨大的资源和人力浪费,对于产业规模的持续发展产生了制约。为此,亟需建立开放、中立和公正的多样性算力测评工具平台和一致的测评体系,来降低重复性的工作,以及树立有序竞争的产业环境促进多样性算力持续创新。
01科学布局,支撑多样性算力生态建设
2021年中国移动全球合作伙伴大会期间,中国移动联合业界多家芯片公司共同打造的多样性算力芯片孵化平台“芯巢”举行了发布仪式,聚焦“计算”与“数字本质,以孵化新型芯片为要义,提升多元化计算能力,构建开放、健全的多样性算力生态系统。时隔两年,2023年4月24日第二届多样性算力产业峰会上,为推动多样性算力技术和产业发展,中国移动、华为、清华大学、中国电信、中国联通等11家初创成员共同发起成立多样性算力产业及标准推进委员会,并发布“芯巢多样性算力孵化平台”(简称“芯巢平台”),构建敏捷、智能的芯片孕育环境,助力产业打造开放、健全的多样性算力生态体系。
从“芯巢”到“芯巢平台”,其宗旨在于通过以标准规范为牵引,以孵化迭代为途径,以产业推广为目的的一整套解决方案,以期助力提升国内多样性算力芯片能力,快速满足通信等重点行业极致要求的算力孵化平台;其意义在于芯巢平台可以提供节约人力重复性芯片测试工作、快速评估芯片服务能力、验证多产品之间兼容性满足程度、提供可视化报告等服务,持续推动多样性算力发展。
如会上郑纬民院士所总结道:“多样性算力的规模部署,关键在于两个方面,一是供给方做好软硬件协同和异构融合创新,释放多样性算力潜能;二是需求方牵头构建一致性测评体系,以需求和评测牵引产品快速迭代,引导用户敢用、多用经过测评认证的多样性算力产品。”
而当前,用户在采购算力软硬件产品时,往往需要面临多种选择。这需要辨别各家产品的性能、功能、兼容性、安全和可靠性等,以及考虑厂商提供产品和技术后的供应保障能力,确保业务系统的连续性和供应链的安全性。鉴于算力基础设施供应链的复杂性,多样性算力测评和验证为最终的基础设施业主和运营方提供了多维度的测评和标准规范,如供应可靠性测评、功能性能测评、兼容性测评等。同时,测评流程规范化并符合国家和国际自愿性团体标准的规则制定,代表了产业链厂商的共识,为用户提供更有力的算力基础设施采购和招标参考。
多样性算力的测评体系依赖大量的测试工具与IT平台来提升测试的效率,芯巢将作为整体工具平台的一个重要组成部分。在推委会的总体协调下为广大成员提供服务。
02国内算力产品相关的测评或认证体系面临的挑战
目前,国内算力产品的测评和认证体系还存在着一系列问题。首先,这个体系呈现出碎片化的现状。不同领域的企业标准、行业标准以及测评机构自定义的测评准则和工具导致缺乏统一的面向用户需求的测评体系。这样的现状会导致测试结果无法在用户间得到相互认可,各个用户单位都要自行组织测评活动,这样就会造成巨大的资源和人力浪费。
其次,测评结果缺乏可对比性。现有的测试标准规范过于注重产品能力条目的设置,而普遍缺乏等级或者分数权重设置。测试结果通常只能发放证书或者是只能区分各个能力项通过与否的测试报告。这样,产品的测评结果是区分不出能力等级或者测评分数高低的。各测试结果之间很难进行对比,也无法满足用户单位支撑采购排名的诉求,测评结果不能支撑商业评价和采购的能力。
再次,部分评测规范和工具与用户需求脱节。第三方测评机构自行定义的测评准则或者测评工具,如各类国产化测评,缺乏相关的标准支撑或者产业共识,执行过程中容易引起争议。同时测评规范在制定过程中缺乏用户单位需求的对齐,所定义的测试内容与用户单位所关心考核内容相差较大。这样,测评活动通常解决不了用户单位的测评需求,导致有实力的用户单位不得不自行组织测试。
最后,测评结果缺乏有效的背书支撑。缺乏能达成产业共识的信用背书体系来支撑产品测评结果的可对比性和可量化性。虽然用户单位对测试结果有排名诉求,但是测评机构对产品的测评等级、等分情况和排名的信用背书存在顾虑。即使某些测评机构自定义测评比拼准则,测评结果的权威性也容易受到挑战。
03如何解决这些测评挑战?
测评孤岛化或者碎片化其实反应了个性化诉求与标准化方法之间的失衡。推委会创造性的提出测试内容的“原子化”和累积满足用户需求的测评项的题库,并允户单位按需从库中编排形成个性化“考题”。推委会对原子化测试项制定过程的公信力负责,对测评实验室的资质进行认定。用户单位可以通过推委会平台提出自己评测需求,参评单位可以自由参加推委会评测项的制定过程。最终形成供需双方、三方评测、推委会平台的多方动态平衡。推委会的三大措施包括:
测评内容“原子化”,广泛覆盖评测需求汇聚为测评项题库
每个测试项定义标准化的测试用例。每个测试项定义独立的得分评判机制。标准附录中为相应的参考权重值。每个测评项成为“原子”,允许用户单位基于这些原子自行编排“测评的分子链”。在推委会吸纳众多用户单位诉求,形成覆盖全面的测试项的“原子库”。
支持个性化的产品考核方案(试卷个性化)
用户单位有采购权这个抓手,可以定义测评排名规则。用户单位既可以完全采用标准附录中定义权重值,也可以个性化定义。从“题库”中采题,或者自增补考题,组成试卷,自行定义权重值。“题库”中的测试项由DCIA认证实验室测试过的结果,可以重用,不需要重新测试,只用户只测新增的。
分布式的背书体系
基于角色进行背书分工,分成定义测评项集合、定义产品排名考核方案、测评执行、测评审核、结果排名等不同环节的背书主体,各主体相互配合,从而组成一个严谨背书分工体系,避免将背书压力过于集中在某个角色(如测评实验室)的弊端,解决产品测评排名难以权威背书的问题。
一个成功的测评体系需要在各方利益、贡献之间达成动态平衡,并在产业化中实现应用与迭代。推委会作为一个产业协作平台,正是达成动态平衡的孵化器。为了在产业应用中实现测评体系的应用与迭代,需要业主方的统一需求牵引,需要参与方的公正与平衡,需要核心工具和平台的构建,也需要最终结果的应用与正向迭代。同时,测评体系建设也是知识产权密集型工作,因此需要尊重知识产权。推委会也将尝试进行测评结果的授权和认定,为国家计算产业发展的公序良俗构建贡献力量。
总的来说,多样性算力测试体系离不开各方的积极参与和支持,每一个环节都需要各个领域的专业人士和机构的不断努力和创新。同时,政府也需要加大对人才培养、科技创新等方面的投入,为算力行业的长期健康发展提供有力的支持。在未来,我们期待更多的人们关注和参与算力领域的发展,共同推动行业的进步和创新。