MMLU,是一项评估大型语言模型语义理解能力的著名测试.
n LLM Leaderboard是HuggingFace社区推出的一个开源大模型排行榜,它基于EleutherAI的语言模型评估框架。
C-Eval的多层次、多学科设计使其成为评估中文语言模型性能的重要工具。
SuperCLUE是一个评估中文大型模型性能的综合性评测基准,它从三个维度衡量模型能力:基础能力、专业能力和中文特性能力。
OpenCompass,这是一个全面的开放评测系统,专为大型语言和多模态模型设计。
MMBench是由上海人工智能实验室联合多所大学共同推出的多模态基准测试。
HELM(Holistic Evaluation of Language Models)是由斯坦福大学开发的全面评估语言模型的框架。
H20 EvalGPT是H20.ai推出的一款工具,旨在评估大型语言模型(LLM)的性能。
Gemma是谷歌DeepMind联合谷歌团队推出的一系列高效AI模型,这些模型以Gemini技术为基础,致力于协助开发者和研究者打造负责任的AI解决方案。
GPT-4(Generative Pre-trained Transformer)是OpenAl 开发的自然语言处理模型 GPT 家族中的第四个版本,该模型依靠强大的神经网络来理解和生成类似人类的语言。
DALL·E 3,由OpenAI开发的新一代文本到图像合成模型,能够根据文本提示创造出图像。
Auto-GPT,一个开源实验项目,展示了GPT-4的强大能力,已在GitHub获得超10万星标。
Jan.ai是一款免费且开源的AI聊天对话工具,它允许用户在本地计算机上部署和运行大型语言模型。
AgentGPT是一个开源项目,它允许用户直接在浏览器中构建、设置和部署自己的人工智能系统。
Olama是一款命令行工具,专为在本地计算机上部署大型语言模型而设计。
阿里巴巴的达摩院推出了一个AI模型社区,其中包含了300多个开源的AI模型。
智源研究院的“悟道”人工智能模型,不仅创下了“中国首例+全球最大”的成就,还在科研领域达到了国际领先水平。
MiracleVision奇想智能,由美图秀秀公司自主研发的视觉大模型,以其卓越的美学和图像处理技术,广泛应用于多个行业,显著提升工作流程效率。
Gradio是一个开源的Python库,专为快速搭建机器学习和数据科学演示以及Web应用而设计。
DeepFloyd IF一个开源的文本到图像生成模型。
Cohere是一个为开发者和企业提供强大语言模型的平台
OpenAI开发的人工智能代码生成训练模型,是一款创新的AI工具。
HuggingFace推出了一款先进的大型语言模型。
Lamini是一个创新的LLM(大型语言模型)引擎,专为简化模型训练流程而设计。
Runway的最新AI视频生成模型代表了视频创作领域的创新。
DeepSpeed是由微软推出的开源框架,旨在以低成本实现大规模模型训练,包括类似ChatGPT这样的先进语言模型
PaLM(Pathways Language Model)是谷歌在2022年4月推出的大型语言模型(LLM),拥有超过5400亿个训练参数。
SAM模型的训练基于庞大的数据集,包含超过1100万张图像和11亿张掩模,使其在图像分割任务中展现出卓越的零样本能力。
HuggingFace AI模型开发社区是一个集开发者、研究人员和爱好者于一体的平台,专注于推动人工智能模型的发展。
这款工具使开发者能够精确调整大型语言模型、准备训练数据集,以及验证AI模型的准确性。