5月28日举行的2023中关村论坛·人工智能大模型发展论坛上,科技部新一代人工智能发展研究中心发布了《中国人工智能大模型地图研究报告》。
《报告》显示
中国研发的大模型数量排名全球第二
仅次于美国
从国内大模型区域分布来看
北京、广东、浙江、上海
处于第一梯队
科技部副部长吴朝晖在论坛上发出四点倡议,呼吁我国学术界与产业界加强研发合作,通过开源形成繁荣的大模型产业生态。
1具身智能将是未来AI形态
“ChatGPT表现出很强的人机对话能力和逻辑推理能力,拉开了迈向通用人工智能的序幕。”吴朝晖说。所谓通用人工智能,就是人工智能像人一样可以做很多事,不再局限于某些特定任务。回答各种问题、撰写各类文案、编写计算机程序……ChatGPT能够完成很多任务;GPT-4在迈向通用人工智能的道路上再进一步,具备了读图能力。
吴朝晖也指出,自然语言大模型并不是大模型的最终形态,比它更高级的是多模态的具身智能。这个观点与英伟达首席执行官黄仁勋相仿,后者近日在一次演讲中预测:人工智能的下一个浪潮是具身智能。所谓具身智能,是将智能算法与机器人的感知、行动和环境交互能力相结合,使机器能够以更自然、更智能的方式与环境进行交互并完成各种任务。
这意味着,除了“大脑”,“身体”对机器智能也很重要。包括ChatGPT等语言大模型在内的人工智能系统,执行的任务大多是数据处理和符号推理,类似人的大脑。而在具身智能系统中,机器人通过感知和行动与外部世界直接交互,再通过与“大脑”联合运行,就能从外部世界中获取知识和经验,并在实践中逐步改进自身能力。
具身智能系统感知到的信息,包括视觉、听觉、触觉、嗅觉等信息,用人工智能术语说,这些是多模态信息。多模态的具身智能,可以让机器人像人类那样感知丰富多彩的外部世界,为大模型“大脑”配备智能化“身体”。
2面向智能增强时代发出倡议
基于大模型的发展趋势预测,吴朝晖表示,我们将进入智能增强时代,这是一个由人、物理世界、机器人、虚拟世界组成的“四元世界”;机器人将拥有自主学习、情感理解等类人智慧特征,与其他“三元”交互后,有望产生超级智能、融合智能等新形态。
面向智能增强的未来,他发出四点倡议:一是坚持开源协作,通过技术创新协同解决透明性、稳定性等大模型共性问题,推动算力资源和数据资源开放共享,加快形成大模型的产业生态;二是坚持场景驱动,加快大模型在制造、医疗、电力等重点领域的落地应用,以应用推动技术迭代升级;三是坚持技术向善,深化人工智能伦理风险和治理体系研究,同时加强大模型安全可信、隐私保护等技术研发;四是坚持开放理念,聚焦大模型助力科学发现、工程研发以及环境治理、能源管理等可持续发展问题,不断深化国际交流合作、开拓国际合作空间。
3国内各地大模型人才都不足
“从全球已发布的大模型分布来看,中国和美国大幅领先,超过全球总数的80%。美国近年来一直排名第一,中国从2020年起进入快速发展期,目前与美国保持同步增长态势。”中国科学技术信息研究所所长、科技部新一代人工智能发展研究中心主任赵志耘说。
她带领团队编写的《中国人工智能大模型地图研究报告》显示,我国14个省市和地区在开展大模型研发,第一梯队是北京、广东、浙江、上海;北京的大模型最多,已发布38个。从模型领域发布来看,自然语言处理是最为活跃的领域,其次是多模态领域,在计算机视觉和智能语音等领域的大模型还较少。从研发主体发布来看,高校、科研机构、企业等创新主体都在积极研发大模型,但学术界与产业界的联合研发案例较少。
这份报告的人才地图显示,北京、江苏、广东、上海是大模型研发人才较多的省市。人工智能和大模型论文作者统计表明,大模型学者指数排名国内前四的是:北京、江苏、广东、上海;人工智能学者指数的排名中,上海位列第三,高于广东。“我国的大模型人才总量是稀缺的。”赵志耘指出,“这个领域的门槛比较高,需要高素质AI人才,目前国内各地的人才数量都不充足。”
报告的开源影响力地图显示,国内已有超过半数的大模型实现开源,北京、广东、上海在开源数量和影响力上均排名前三。高校和科研机构是开源主力,清华大学的ChatGLM-6B、复旦大学的MOSS、百度的文心系列大模型在开源影响力上位居三甲。