大模型-随意门导航

大模型

MMLU,是一项评估大型语言模型语义理解能力的著名测试.

AI模型MMLU大模型大模型测评

Open LLM Leaderboard

n LLM Leaderboard是HuggingFace社区推出的一个开源大模型排行榜，它基于EleutherAI的语言模型评估框架。

AI模型Open LLM Leaderboard大模型大模型测评

C-Eval的多层次、多学科设计使其成为评估中文语言模型性能的重要工具。

AI模型C-Eval大模型大模型测评

SuperCLUE是一个评估中文大型模型性能的综合性评测基准，它从三个维度衡量模型能力：基础能力、专业能力和中文特性能力。

AI模型SuperCLUE大模型大模型测评

OpenCompass

OpenCompass，这是一个全面的开放评测系统，专为大型语言和多模态模型设计。

AI模型OpenCompass大模型测评模型

MMBench是由上海人工智能实验室联合多所大学共同推出的多模态基准测试。

AI模型ChatGPTMMBench大模型

HELM

HELM（Holistic Evaluation of Language Models）是由斯坦福大学开发的全面评估语言模型的框架。

AI模型HELM大模型英语模型

H20 EvalGPT

H20 EvalGPT是H20.ai推出的一款工具，旨在评估大型语言模型（LLM）的性能。

AI模型H20 EvalGPT大模型语言模型

PubMedQA是一个生物医学领域的问答数据集

PubMedQA大模型数据集

智源研究院的“悟道”人工智能模型，不仅创下了“中国首例+全球最大”的成就，还在科研领域达到了国际领先水平。

AI技术AI模型人工智能大模型基础模型研究中心

MiracleVision奇想智能

MiracleVision奇想智能，由美图秀秀公司自主研发的视觉大模型，以其卓越的美学和图像处理技术，广泛应用于多个行业，显著提升工作流程效率。

AI模型CV大模型MiracleVision奇想智能图像模型

“大模型+Agent”技术

agent技术ai学习框架ai智能计算AI编程开发

随意门导航网收录了数千个不同类型的互联网工具网站，帮你融入互联网浪潮！Ctrl + D收藏本站到浏览器书签栏

商务合作友链申请免责声明网站地图

Copyright © 2024 随意门导航粤ICP备2024246821号-1