语言模型-随意门导航

语言模型

MMLU,是一项评估大型语言模型语义理解能力的著名测试.

AI模型MMLU大模型大模型测评

Open LLM Leaderboard

n LLM Leaderboard是HuggingFace社区推出的一个开源大模型排行榜，它基于EleutherAI的语言模型评估框架。

AI模型Open LLM Leaderboard大模型大模型测评

C-Eval的多层次、多学科设计使其成为评估中文语言模型性能的重要工具。

AI模型C-Eval大模型大模型测评

SuperCLUE是一个评估中文大型模型性能的综合性评测基准，它从三个维度衡量模型能力：基础能力、专业能力和中文特性能力。

AI模型SuperCLUE大模型大模型测评

OpenCompass

OpenCompass，这是一个全面的开放评测系统，专为大型语言和多模态模型设计。

AI模型OpenCompass大模型测评模型

HELM

HELM（Holistic Evaluation of Language Models）是由斯坦福大学开发的全面评估语言模型的框架。

AI模型HELM大模型英语模型

H20 EvalGPT

H20 EvalGPT是H20.ai推出的一款工具，旨在评估大型语言模型（LLM）的性能。

AI模型H20 EvalGPT大模型语言模型

LangChain是一个框架，旨在简化语言模型驱动应用的开发。

ai学习框架ai智能计算AI编程开发LangChain

随意门导航网收录了数千个不同类型的互联网工具网站，帮你融入互联网浪潮！Ctrl + D收藏本站到浏览器书签栏

商务合作友链申请免责声明网站地图

Copyright © 2024 随意门导航粤ICP备2024246821号-1