MMBench是由上海人工智能实验室联合多所大学共同推出的多模态基准测试。它设计了一个细致的评估流程,从感知到认知逐层评估,涵盖20种细粒度能力,并从互联网和权威数据集中收集了约3000个单项选择题。MMBench摒弃了传统的一问一答模式,采用循环打乱选项的方法来验证评测结果的一致性,并利用ChatGPT技术精确匹配模型回答与选项,提升了评测的准确性和可靠性。
官网地址是:https://mmbench.opencompass.org.cn/leaderboard
MMBench首页预览
数据评估
关于MMBench特别声明
本站随意门导航提供的MMBench都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由随意门导航实际控制,在2024年12月2日 上午11:33收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,随意门导航不承担任何责任。