C-Eval是由上海交通大学、清华大学和爱丁堡大学的研究团队于2023年5月共同开发的中文大模型评估工具。这个评估套件包含13948道多项选择题,覆盖52个学科领域,并分为四个难度等级,旨在全面测试大模型对中文的理解能力。C-Eval的多层次、多学科设计使其成为评估中文语言模型性能的重要工具。
官网地址是:https://cevalbenchmark.com/static/leaderboard_zh.html
C-Eval首页预览
数据评估
关于C-Eval特别声明
本站随意门导航提供的C-Eval都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由随意门导航实际控制,在2024年12月2日 上午11:57收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,随意门导航不承担任何责任。