SuperCLUE是一个评估中文大型模型性能的综合性评测基准,它从三个维度衡量模型能力:基础能力、专业能力和中文特性能力。基础能力涉及语义理解、对话、逻辑推理等10项技能。专业能力覆盖中学至专业考试水平,包含数学、物理、地理和社会科学等50多个领域。中文特性能力则专注于中文特有的任务,如成语、诗歌、文学和字形等10种能力,全面评估模型在中文语境下的表现。
官网地址是:https://www.cluebenchmarks.com/static/superclue.html
SuperCLUE首页预览

SuperCLUE
数据评估
关于SuperCLUE特别声明
本站随意门导航提供的SuperCLUE都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由随意门导航实际控制,在2024年12月2日 上午11:51收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,随意门导航不承担任何责任。