11月28日,中国教育和科研计算机网cernet第二十八/二十九届学术年会在福州开幕。会上,清华大学计算机系教授唐杰作了题为《生成式人工智能大模型的现状和未来》的特邀报告,总结了人工智能大模型的发展历程,并对大模型的未来进行了展望。
唐杰 清华大学计算机系教授
2020年:大模型元年
唐杰表示,预训练大模型是新一代人工智能应用的基础设施。大模型通用能力强,可完成多场景任务。从2018年到现在,其趋势是由单模态向多模态发展,从文本逐步发展到视觉。
据唐杰介绍,open ai引领了agi(人工通用智能)的研究。2020年,gpt-3推出。gpt-3是跨时代意义的语言大模型,标志ai文本生成进入下一个阶段。因此,2020年可以称之为大模型元年。
今年,gpt-4发布。与gpt-3.5相比,gpt-4的数学能力、微积分能力大大增强,开始具备逻辑推理能力、求解能力,并且走向了多模态,实现图像和文本输入。而gpt-4.5(aii tools)具有很强的agent(智能体)能力,融合多种工具的agent形态,通过网页浏览、代码解释、文件解析、图片生成、图片理解,以及多工具结合,无需手动指定工具,能够自动触发。
唐杰表示,gpt-4/4.5的出现表明,我国在大模型上的研究还有空间,也需要继续努力。此外,目前来看,亟需建立以中文为核心的自研大模型。
大模型发展历程
唐杰认为,可以把gpt(生成式预训练transformer模型)的发展分为三个阶段。第一阶段是“千亿基座模型”,相当于机器把世界上所有的书读了个遍,把知识都学会,但“饱读诗书”的大模型却未必会“考试”;第二阶段是“有监督指令微调”,相当于“教”大模型怎么“考试”,怎么回应痛点,怎样跟人类的思维方式对齐;第三阶段是“人类反馈强化学习”,将强化学习与人类反馈相结合,利用人类提供的反馈来指导大模型的行为。
为什么agi会迎来爆发?唐杰进一步回顾了人工智能的发展历程。
他表示,人工智能的发展可以分为三个时期。第一个时期是“符号ai”,实现了知识的可搜索性,让计算机用描述语言把人类知识描述出来,这一阶段以各种“专家系统”为代表。第二个时期是“感知智能”,实现了知识的可计算性,大数据驱动的统计学习方法初步实现了针对文本、图像、语音等的感知与识别。第三个时期是“认知智能”,实现了认知的可计算性。中科院院士、清华大学教授张钹在2016年提出第三代人工智能雏形,darpa(美国国防高级研究计划局)在2018年发布“ai next”计划。核心思路是推进数据统计与知识推理融合的计算,与脑认知机理融合的计算。在此阶段,机器“认知”实现了元学习:自动学习认知目标。而目前急需的是高质量超大规模知识图谱(ai的基础设施)以及对超大规模数据的深度理解能力(面向认知的深度学习)。
解密大模型
2017~2018年,随着transformer的诞生,语言模型规模迅速扩大。大模型的出现还带来了in-context能力(隐含模式迁移)。一方面,大规模模型算力需求迅速增长,单模型计算量每年增长10倍,形成新的“摩尔定律”;另一方面,机器智能的规模效应,拥有量变到质变的能力,在千亿稠密参数(~100b,或 1023flops训练量)时模型能力开始出现“涌现”。
唐杰总结道,总的来说,大模型理论研究还明显落后于工程进展。我们在工程上看到了很多现象,但在理论上却解释得不够清楚。
为解密大模型,对标gpt系列模型,唐杰及团队推出了glm系列模型。据唐杰介绍,glm系列把千亿基座模型、有监督指令微调、人类反馈强化学习这三个阶段相对压缩了时间,并在算法方面进行了创新,提出“自回归填空”。2022年,在斯坦福大学大模型中心报告的世界主流大模型评测中,glm-130b是亚洲唯一入选模型,其准确性、恶意性与gpt-3持平,鲁棒性和校准误差在所有模型中表现最佳。
2024年:agi元年?
唐杰表示,对于未来agi的走势,我们还面临很多挑战。首先,从工程角度看,scaling(规模化)的尽头是agi吗?一方面,真正的scaling规模远超学术界想象。扩大规模不仅仅基于参数量,更多的是基于计算量。另一方面,scaling仍有空间,单卡摩尔定律放缓,但系统角度仍在延续。
唐杰进一步表示,scaling的真正极限,也许是agi的一点曙光。未来更大的挑战是,人类的认知到底是怎样的?从人类大脑进化的历程来看,脑容量逐渐扩张,在此过程中人类实现了工具能力、语言能力等等,那么大模型的发展是否也可以遵循人脑进化的道路,慢慢发展出工具能力、语言能力和其他能力?从这一点看,agi之路还很长。
据了解,日前,open ai提出超级对齐(superalignment)的概念。唐杰表示,superalignment本质上就是超级智能与超级安全,是让agi跟人类的价值观意识观对其,并且实现超过人类智能的智能。从这一点看,也许2024年将是agi的元年。
本文根据清华大学计算机系教授唐杰在cernet第二十八/二十九届学术年会上的报告整理,点文末“阅读原文”可进入cernet第二十八/二十九届学术年会专题
① 凡本站注明“稿件来源:中国教育在线”的所有文字、图片和音视频稿件,亚博安卓的版权均属本网所有,任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本站协议授权的媒体、网站,在下载使用时必须注明“稿件来源:中国教育在线”,违者本站将依法追究责任。
② 本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及亚博安卓的版权等问题,请作者在两周内速来电或来函联系。