MMLU,即Massive Multitask Language Understanding,是一项评估大型语言模型语义理解能力的著名测试,由加州大学伯克利分校的研究者于2020年9月发布。这项测试包含57个任务,覆盖了初等数学、美国历史、计算机科学和法律等多个领域。MMLU使用英文,旨在衡量大模型的知识广度和理解深度,是评估模型基本语言理解能力的重要工具。
官网地址是:https://paperswithcode.com/sota/multi-task-language-understanding-on-mmlu
MMLU首页预览
数据评估
关于MMLU特别声明
本站随意门导航提供的MMLU都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由随意门导航实际控制,在2024年12月2日 下午12:07收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,随意门导航不承担任何责任。