大模型测评-随意门导航

大模型测评

MMLU,是一项评估大型语言模型语义理解能力的著名测试.

AI模型MMLU大模型大模型测评

Open LLM Leaderboard

n LLM Leaderboard是HuggingFace社区推出的一个开源大模型排行榜，它基于EleutherAI的语言模型评估框架。

AI模型Open LLM Leaderboard大模型大模型测评

C-Eval的多层次、多学科设计使其成为评估中文语言模型性能的重要工具。

AI模型C-Eval大模型大模型测评

SuperCLUE是一个评估中文大型模型性能的综合性评测基准，它从三个维度衡量模型能力：基础能力、专业能力和中文特性能力。

AI模型SuperCLUE大模型大模型测评

随意门导航网收录了数千个不同类型的互联网工具网站，帮你融入互联网浪潮！Ctrl + D收藏本站到浏览器书签栏

商务合作友链申请免责声明网站地图

Copyright © 2024 随意门导航粤ICP备2024246821号-1