中国信通院人工智能研究所魏凯:基础模型与工程化体系为“人工智能+”铺平道路
“如果只用一个字描述2024年的人工智能,那就是‘快’,展望2025年,人工智能的进步仍然不会减速,”在中国信息通信研究院人工智能研究所所长魏凯看来,“一切仿佛按下了加速键,基础大模型技术加速迭代,工程化和应用赋能加速落地,安全治理也从原则走向实践。”
魏凯在12月23日举办的“2025中国信通院深度观察报告会”上分享了上述感受。他说,目前以大模型为主线的人工智能技术还远未定型,技术创新非常活跃。头部企业沿着规模定律,不断刷新基础大模型的能力上限。无论以任何一种基准得分为参照,梳理一年来前沿模型的提升趋势,都会呈现一条陡峭向上的曲线。
2024年下半年以来,关于预训练扩展遇到瓶颈的讨论越来越多。在此背景下,o1等模型的推出,为大语言模型开辟了新的扩展方向,扩展定律在另一条路上继续推进。与此同时,从Sora、可灵、Vidu,到GPT-4o,多模态生成模型和理解模型也在2024年快速发展,打开机器认知和理解世界的全新通道,为后续具身智能和AGI发展奠定基础。
值得一提的是,基础模型在“变大”的同时也在“变小”。不少只有几十亿参数的小模型涌现出来,在某些方向上,性能可以达到以往千亿甚至万亿参数的水平。由于小模型能力聚焦,有望大大降低算力和应用成本,加速私有部署和边缘与端侧AI的普及。
魏凯认为,基座大模型演进的新趋势,会引发算力和数据两大要素的结构性变化。在算力方面,虽然现在万卡集群建设如火如荼,但随着预训练主体的逐步收敛,考虑到高昂的建设运营成本,未来全球估计只有少数公司真正需要超大规模训练集群,超大规模训练需求可能很快将达到顶峰。与此相对的,应用的普及,推理侧的扩展,以及运行大模型所需的推理算力需求将被激发,推动智算算力结构做出相应调整。
在数据方面,有不少观点认为,规模定律将放缓甚至走到尽头,这与数据墙有关。研究显示,全球可公开获取的互联网数据已接近天花板。未来突破数据墙有两个途径,一是合成数据,二是数据精标,这就对人工智能的数据要素供给提出了新要求。此外,在以CommonCrawl等为源头的公开互联网数据集之外,企业数据和深网(deep web)数据是有待进一步挖掘的“蓝海”。我国数据资源总量丰富,应抓住机遇,加快培育高水平数据标注产业,挖掘高质量数据资源潜力。
“基础模型只是整个人工智能应用架构中的一部分,甚至只是一小部分。”魏凯进一步指出,2024年围绕大模型的工程化体系不断成熟,AI原生应用的架构实践往前迈出了一大,检索增强生成(RAG)、智能体、多智能体工作流等工程化技术得到快速发展。
如果把大模型比作操作系统,那么智能体就像APP。智能体以大模型为智能中枢,融合规划、记忆和工具调用等能力,在众多领域初步展现出巨大潜力。人工智能的工程化技术,看似技术含量不高,但实则至关重要,是联结前沿技术和用户实际场景的桥梁,在降低幻觉、提升应用效果的同时,能显著降低用户使用大模型的门槛。
“虽然互联网大厂纷纷推出MaaS服务和智能体开发平台,但总体上看,人工智能应用服务领域的企业仍然不够多、不够强。我们正在与大厂合作,积极培育大模型服务提供商生态。”魏凯说。
实际上,基座模型不断进步和工程化持续成熟,为“人工智能+”铺平了道路。“我们看到,随着国家实施‘人工智能+’行动,大力推动人工智能赋能新型工业化,大模型在工业领域的应用案例越来越多,我们统计发现,价值链两端率先启动。”魏凯强调。
在工业领域的源头创新方面,大模型在软件开发中的应用最为广泛,材料和药物研发、仿真设计等也在探索中,AI提升研发效能方面的成效初现。在后端场景中,企业管理、客户服务、市场营销这3个场景,充分发挥了当前大模型的强项,成为各类企业较为普遍的入门场景。此外,消费端办公助手、智能搜索等应用量大面广,有望极大提升企业员工的人效,同样也是人工智能赋能实体经济的重要方向。
魏凯强调,“人工智能+”还处于发展初期,政府和企业要应用人工智能,也是系统工程,不仅需要持续夯实数字化基础,更需要加快理念、组织和流程等变革。