国内大模型评测数据集（MMCU）问世加速完善国产AI产业图谱

　　在当下人工智能领域，大语言模型将为各行各业带来颠覆性的效率革命和体验升级，这已经成为了业界共识。借此，一场由ChatGPT引发的“百模大战”早已轰轰烈烈地拉开序幕，纵观整个科技圈，几乎所有高科技公司都在打造自己的大语言模型，更有专家断言，不出意外，将很快升级为“千模大战”。

　　面对国内大语言模型万箭齐发的局面，如何更好地提升大语言模型对中文的理解能力，更好地服务于中文用户，甲骨易AI研究院推出了高质量中文评测数据集——一款名为“超越”(Massive Multitask Chinese Understanding，简称MMCU)的大规模的多任务测试数据集，填补了中文大语言模型能力测试缺失的一大空白。5月20日，一场以“大模型实际应用与场景化落地”为主题的研讨沙龙暨“超越”MMCU测试数据集产品发布会在甲骨易第三空间拉开序幕。

　　本次沙龙由甲骨易AI研究院主办，来自中科院、北京大学、北京外国语大学、哈萨克恩斯坦国立大学等学术界代表，中关村软件园、小米、咪咕、快手、商汤、霖珑云、博思众智、智谱华章、中航出版传媒等产业界代表以及多家科技媒体代表出席了本次沙龙活动，并针对大语言模型的数据量与评价标准等相关话题，畅所欲言，展开了热烈的讨论。

　　迈向认知智能演进的过程

　　在本次沙龙活动中，北京外国语大学人工智能与人类语言重点实验室主任、多语自然语言处理研究中心主任李佐文进行了精彩的开场致辞。李佐文认为，语言智能包括对人类语言机理的研究以及对自然语言的技术处理研究两大板块，这两个领域都应深入研究，并肩发展，机器方能有望像人一样理解自然的语言，生成自然的语言。来自甲骨易的数据服务事业部负责人王敏在致辞中提及，甲骨易创始之初正是为了搭建人与人之间的沟通交流，跨越语言跨越文化之间的障碍，而当下正是要搭建人与机器，甚至是机器与机器之间的沟通桥梁——这也正是甲骨易AI研究院成立的初心。

　　众所周知，人工智能技术在飞速演进。沙龙上，来自小米公司的大模型数据负责人彭力进行了以《小米遇上大模型》为主题的精彩演讲，他介绍了业界中定义的人工智能产业发展演变的四个层面：第一层叫运算智能层（早已实现），第二层叫感知智能层（目前已在多领域接近人类水平），第三层是认知智能（尚在推进中），第四层才是通用智能层（尚有距离）。其中，第三层的认知智能指的是在感知智能的基础上进一步的理解、思考和解释。他指出，我们正在向通用人工智能演进，而大语言模型则可以加速人工智能演进的进程与当前面临的技术难点，并展示了小米在大语言模型领域的新进展。

　　实际上，ChatGPT早期主要是针对文本语料进行大规模的学习，后来数据参数达到了数千亿量级，便有了大语言模型的说法。彭力表示，在训练大语言模型的过程中，诸如广告等噪声数据，以及大量的同质化语料等因素都会影响训练的效果，甚至还会面临数据版权的风险。来自北京外国语大学的李佐文则在分享中直言，业界通过自然语言处理等办法，竭尽全力想让机器理解人类的语言，依旧是挑战重重。

　　国产中文大语言模型体系亟待完善

　　我们需要看清这样的现实，国内大语言模型和国际一流仍有差距，超越并非一朝一夕就可以实现。当下，国内厂商往往采取的是模仿与跟随策略，尽管未来有望弯道超车，甚至后来者居上，但当下就有一些厂商宣称将实现通用模型对标ChatGPT，中文大模型能够超越ChatGPT的当前版本，与之旗鼓相当，并在多领域做到业界领先，无疑这样的说辞，也只是停留在口号之上，尚未经过实践验证。

　　尽管对标ChatGPT等豪言壮语已响彻耳畔，但只凭借厂商只言片语的宣传描述，以及对特