架构师_程序员_码农网

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

搜索
查看: 271|回复: 1

【AI】(一)开源大模型排行榜

[复制链接]
发表于 2024-12-28 10:03:05 | 显示全部楼层 |阅读模式
Chatbot Arena LLM 排行榜:https://lmarena.ai/

Chatbot Arena 是一个众包 AI 基准测试的开放平台,由加州大学伯克利分校SkyLab和LMArena的研究人员开发。该平台拥有超过 1,000,000 个用户投票,使用 Bradley-Terry 模型生成实时排行榜,对最佳 LLM 和 AI 聊天机器人进行排名。有关技术细节,请查看我们的论文。

QQ截图20241228095957.jpg

LiveBenchhttps://livebench.ai/#/

专为 LLM 设计的基准,设计时考虑到了测试集污染和客观评估。

QQ截图20241228100010.jpg

SuperCLUE总排行榜:https://www.superclueai.com/

CLUE定位:为更好的服务中文语言理解、任务和产业界,做为通用语言模型测评的补充,通过搜集整理发布中文任务及标准化测评等方式完善基础设施,最终促进中文NLP的发展。

QQ截图20241228100108.jpg

Open LLM Leaderboardhttps://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard#/

以开放和可重复的方式比较大型语言模型

QQ截图20241228100127.jpg





上一篇:将 Blob 图片复制到到剪贴板
下一篇:【转】Angular 移除 Zone.js 探索 Zoneless 新方案
码农网,只发表在实践过程中,遇到的技术难题,不误导他人。
 楼主| 发表于 2024-12-28 10:20:27 | 显示全部楼层
Qwen是阿里巴巴集团Qwen团队研发的大语言模型和大型多模态模型系列。
Qwen2.5https://github.com/QwenLM/Qwen2.5

DeepSeek-V3 为自研 MoE 模型,671B 参数,激活 37B,在 14.8T token 上进行了预训练。
DeepSeek-V3https://github.com/deepseek-ai/DeepSeek-V3

智谱是由清华大学计算机系技术成果转化而来的公司
GLM-4-9Bhttps://github.com/THUDM/GLM-4

码农网,只发表在实践过程中,遇到的技术难题,不误导他人。
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

免责声明:
码农网所发布的一切软件、编程资料或者文章仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站信息来自网络,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。如有侵权请邮件与我们联系处理。

Mail To:help@itsvse.com

QQ|手机版|小黑屋|架构师 ( 鲁ICP备14021824号-2 )|网站地图

GMT+8, 2025-2-18 16:45

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表