架构师_程序员_码农网

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

搜索
查看: 982|回复: 2

【AI】(二)DeepSeek-V3 vs R1 版本区别

[复制链接]
发表于 2025-2-5 08:46:09 | 显示全部楼层 |阅读模式
DeepSeek-R1

发布时间:2025/01/20
特点:专为代码生成和数学问题设计,速度极快,精确度高,非常适合需要快速实现技术需求的场景。对标的OpenAI o1,这个是现在AI大模型领域最炙手可热的方向,代表了最尖端的研究储备。
适用人群:程序员、开发者、理工科学生。
应用场景:编写代码、解决数学难题、优化算法。
deepseek_r1_benchmark.png
参考:超链接登录可见。

DeepSeek-V3

发布时间:2024/12/26
特点:适用于通用知识问答、文本创作和学习辅助,覆盖面广泛但专业性稍弱。对标的是GPT4o,代表的是大模型最根本的通用智能程度。
适用人群:学生、创作者、日常知识查询者。
应用场景:撰写文章、查找资料、学习新概念。
ds_v3_benchmark_hist_zh.jpeg
参考:超链接登录可见。

总结

特征
DeepSeek-V3
DeepSeek-R1
训练方法
使用传统的训练方法,主要依靠大量的数据来学习。
采用强化学习的方法,让模型通过不断尝试和改进来提高自己的能力。
推理能力
在一般任务上表现良好,但在需要深度思考的问题上可能有局限。
在数学、代码和逻辑推理等需要深度思考的任务上表现出色。
开源情况
可能有一些限制。
完全开源,任何人都可以免费使用和改进。
性能
在一些任务上表现不错。
在数学测试中,准确率达到77.5%,与其他领先的模型相当。
可读性
生成的内容通常易于阅读和理解。
早期版本可能会混合多种语言,后来通过改进,生成的内容变得更易读。

  • 训练方法: 想象你在学习骑自行车。DeepSeek-V3就像是通过阅读大量关于如何骑自行车的书籍来学习,而DeepSeek-R1则是通过不断地实际练习,摔倒了再爬起来,从而学会骑自行车。
  • 推理能力: 如果给你一个复杂的数学难题,DeepSeek-R1就像是一个善于深度思考的同学,能够一步步推导出答案,而DeepSeek-V3可能更擅长简单的计算题。
  • 开源情况: DeepSeek-R1就像是一本公开的食谱,任何人都可以查看、使用并根据自己的口味进行改进,而DeepSeek-V3的食谱可能只有部分人能看到。
  • 性能: 在一次数学考试中,DeepSeek-R1得了77.5分,这与其他顶尖学生的成绩相当。
  • 可读性: 最初,DeepSeek-R1写的文章可能会混合使用多种语言,后来经过改进,现在它写的文章更容易阅读和理解。

Deepseek V3和 Deepseek R1 的区别,就是一个R1会进行自我推理反思,长思考过后才会给你答案,而 Deepseek V3 可以很快给出你答案,不会进行长时间思考。目前,大部分实验都表明,长思考过后的模型输出要更优秀,但是也更耗时,有时候也会进行过度的思考。




上一篇:深度学习常见的模型(.pt、.onnx)文件格式
下一篇:【AI】(三)腾讯云使用 HAI 部署 DeepSeek-R1 教程
码农网,只发表在实践过程中,遇到的技术难题,不误导他人。
 楼主| 发表于 2025-2-5 09:47:07 | 显示全部楼层
【AI】(一)开源大模型排行榜
https://www.itsvse.com/thread-10909-1-1.html
码农网,只发表在实践过程中,遇到的技术难题,不误导他人。
 楼主| 发表于 2025-2-5 16:26:32 | 显示全部楼层
运行 DeepSeek-R1 的 GPU 系统要求:https://apxml.com/posts/gpu-requirements-deepseek-r1
码农网,只发表在实践过程中,遇到的技术难题,不误导他人。
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

免责声明:
码农网所发布的一切软件、编程资料或者文章仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站信息来自网络,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。如有侵权请邮件与我们联系处理。

Mail To:help@itsvse.com

QQ|手机版|小黑屋|架构师 ( 鲁ICP备14021824号-2 )|网站地图

GMT+8, 2025-6-15 19:51

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表