英伟达市值蒸发近6000亿美元!DeepSeek美区下载榜超ChatGPT,DeepSeek-R1性价比之王

英伟达市值蒸发近6000亿美元!DeepSeek美区下载榜超ChatGPT,DeepSeek-R1性价比之王

标题: 英伟达市值蒸发近6000亿美元!DeepSeek美区下载榜超ChatGPT,DeepSeek-R1性价比之王

作者: 后端研发Marion

描述: 一、DeepSeek R1 模型介绍 1、近期影响力:在国内外表现出色,美区下载榜已超过 ChatGPT。 2、模型发展及特点 1)性能与成本:12 月发布的 V3 模型在 AI 领域掀起浪潮,性能与四欧、Sonnet 比肩,成本低;1 月发布的版本成本仅为 GPT - 4o 的 1/10,提高了大语言模型推理能力,与此前的概率模型(如 GPT3.5)不同,能更接近人类思考推理出结果。 2)训练方式探索 R1 模型方向:基于强化学习,让大语言模型学会自动思考,挑战了 O1 理论里的 COT 方式,在实现单元模式上从不同方向探索并取得成功,主要通过直接强化学习、多阶段模型蒸馏三种方式训练模型。 R1 Zero 模型 训练路径:采用纯强化学习路径,抛弃监督微调,简化为仅用奖惩机制做模型优化,类似让天才儿童自主解题,通过简单奖惩规则(准确性、格式奖励和简单规则)自我提升,降低训练成本。 学习过程与效果:模型学习过程有顿悟方式,如解答数学题时会停下来重新审视整体过程,实现思维节约。在竞赛中,R1 Zero 准确率从 14 提升到 71,同一问题回答准确率保持在 86% ,在编程竞赛中超过 6% 的人类选手。 缺点与改进:缺点是思维方式难以理解,存在可读性差和语言混杂问题。引入冷启动术语和多间断训练两个方案,保持强大推理能力的同时可像人类一样思考,在 Mama th 基准测试上与 O1 接近,80% 投票超过 O1,为大语言模型训练提供新方向。 二、DeepSeek 实践操作 1、Ollama 平台:是模型下载平台,可在官网下载。下载后通过本地命令(如 ollama run + 模型参数,R1 默认为 7B 模型)运行,下载完成后即可通过命令进行对话。 2、Dify 项目 平台特点:开源的智能体平台,功能与 core 平台类似。 操作步骤 1)平台启动:从 github 下载运行 Docker compose 启动脚本,启动 9 个服务(如微博服务、resef 服务),Mac 电脑可直接查看组件运行情况,若遇问题可单独部署,本地访问localhost可打开 dify 本地网站。 2)用户账号与模型配置:首次进入需初始化用户账号,创建应用时默认 GPT 模型会报错,需设置模型。可将 DeepSeek 后台 AK 复制过来读取模型(支持 chat 和 code 合并的 VC 模型),也可接入本地 Olama 模型(填写本地路径、11434 端口及模型名称)。 3)创建应用与模型选择:创建应用时可选择 chat 和 code 模型并设置参数(如温度、输出标记、top key、奖品规则等)。 4)知识库创建与设置:设置角色后添加上下文为商业知识库,可创建或选择企业内部文档。设置分段参数(分段标识符、最大大小、检索窗口大小、重叠长度)对文档进行分段,分段越精细,知识库回答越精准,设置完成后导入知识库。导入后可进行知识检索测试,若检索不精准,可能需用知识图谱方式微调 参考文章:https://mp.weixin.qq.com/s/cp4rQx09wygE9uHBadI7RA

UP主签名:

相关搜索: 人工智能 AI dify deepseek ollama 智能体平台 deepseek-r1 性价比 大模型

推荐视频

vLLM vs Ollama,DeepSeek本地部署框架如何选择?

vLLM vs Ollama,DeepSeek本地部署框架如何选择?

作者: 神秘的鱼仔

播放量: 22590

发布时间: 2025-02-27 18:00:00

打工人神器DeepSeek接入Office、WPS、Word、Excel、PPT

打工人神器DeepSeek接入Office、WPS、Word、Excel、PPT

作者: 尚硅谷

播放量: 269870

发布时间: 2025-02-27 10:13:44

win10安装Docker+Dify 50%人的门槛,你成功了?

win10安装Docker+Dify 50%人的门槛,你成功了?

作者: 闲余凡身

播放量: 3894

发布时间: 2025-02-26 19:11:02

去杭州转了一圈,我发现行情真的变了

去杭州转了一圈,我发现行情真的变了

作者: CodeSheep

播放量: 117734

发布时间: 2025-03-18 20:30:00

超好用~Dify自然语言查询数据库插件

超好用~Dify自然语言查询数据库插件

作者: 有趣程序员的boredlife

播放量: 8816

发布时间: 2025-03-17 21:41:42

6.基于qwen2.5实现一个deepseek-r1(qwen版本)

6.基于qwen2.5实现一个deepseek-r1(qwen版本)

作者: 小林绿子的怀中猫

播放量: 1212

发布时间: 2025-03-03 01:46:22

如此简单!DeepSeek联网搜索(火山方舟、华为云)

如此简单!DeepSeek联网搜索(火山方舟、华为云)

作者: 拂晓的海洋

播放量: 1080

发布时间: 2025-02-27 18:20:00

解放双手 提高产能 | DeepSeek+Blender

解放双手 提高产能 | DeepSeek+Blender

作者: 十月映画

播放量: 68451

发布时间: 2025-02-23 14:06:51

DeepSeek接入知识库化身AI客服,让你生产力直接爆炸

DeepSeek接入知识库化身AI客服,让你生产力直接爆炸

作者: IT椰子

播放量: 449

发布时间: 2025-02-27 20:06:04

Deepseek从1.5b到70b答题测试?7b比8b强??

Deepseek从1.5b到70b答题测试?7b比8b强??

作者: 鹏哥的AI

播放量: 8274

发布时间: 2025-03-02 22:13:28

DeepSeek-GRPO

DeepSeek-GRPO

作者: RethinkFun

播放量: 6558

发布时间: 2025-03-11 22:15:16

Deepseek-R2即将发布?是营销还是事实?

Deepseek-R2即将发布?是营销还是事实?

作者: 天平下的真理

播放量: 1067

发布时间: 2025-03-16 08:19:12

重磅!一键让你的DIFY知识库准确率提高到90%

重磅!一键让你的DIFY知识库准确率提高到90%

作者: Illidan946

播放量: 10968

发布时间: 2025-03-12 17:02:39

你的deepseek也降智了?别急,解决办法来了!!!

你的deepseek也降智了?别急,解决办法来了!!!

作者: Erggfg

播放量: 4686

发布时间: 2025-03-17 11:05:25

docker+dify 一键安装 分分钟搞定 不存在失败!

docker+dify 一键安装 分分钟搞定 不存在失败!

作者: 闲余凡身

播放量: 3651

发布时间: 2025-02-27 15:32:02