作者: 后端研发Marion
描述: 一、DeepSeek R1 模型介绍 1、近期影响力:在国内外表现出色,美区下载榜已超过 ChatGPT。 2、模型发展及特点 1)性能与成本:12 月发布的 V3 模型在 AI 领域掀起浪潮,性能与四欧、Sonnet 比肩,成本低;1 月发布的版本成本仅为 GPT - 4o 的 1/10,提高了大语言模型推理能力,与此前的概率模型(如 GPT3.5)不同,能更接近人类思考推理出结果。 2)训练方式探索 R1 模型方向:基于强化学习,让大语言模型学会自动思考,挑战了 O1 理论里的 COT 方式,在实现单元模式上从不同方向探索并取得成功,主要通过直接强化学习、多阶段模型蒸馏三种方式训练模型。 R1 Zero 模型 训练路径:采用纯强化学习路径,抛弃监督微调,简化为仅用奖惩机制做模型优化,类似让天才儿童自主解题,通过简单奖惩规则(准确性、格式奖励和简单规则)自我提升,降低训练成本。 学习过程与效果:模型学习过程有顿悟方式,如解答数学题时会停下来重新审视整体过程,实现思维节约。在竞赛中,R1 Zero 准确率从 14 提升到 71,同一问题回答准确率保持在 86% ,在编程竞赛中超过 6% 的人类选手。 缺点与改进:缺点是思维方式难以理解,存在可读性差和语言混杂问题。引入冷启动术语和多间断训练两个方案,保持强大推理能力的同时可像人类一样思考,在 Mama th 基准测试上与 O1 接近,80% 投票超过 O1,为大语言模型训练提供新方向。 二、DeepSeek 实践操作 1、Ollama 平台:是模型下载平台,可在官网下载。下载后通过本地命令(如 ollama run + 模型参数,R1 默认为 7B 模型)运行,下载完成后即可通过命令进行对话。 2、Dify 项目 平台特点:开源的智能体平台,功能与 core 平台类似。 操作步骤 1)平台启动:从 github 下载运行 Docker compose 启动脚本,启动 9 个服务(如微博服务、resef 服务),Mac 电脑可直接查看组件运行情况,若遇问题可单独部署,本地访问localhost可打开 dify 本地网站。 2)用户账号与模型配置:首次进入需初始化用户账号,创建应用时默认 GPT 模型会报错,需设置模型。可将 DeepSeek 后台 AK 复制过来读取模型(支持 chat 和 code 合并的 VC 模型),也可接入本地 Olama 模型(填写本地路径、11434 端口及模型名称)。 3)创建应用与模型选择:创建应用时可选择 chat 和 code 模型并设置参数(如温度、输出标记、top key、奖品规则等)。 4)知识库创建与设置:设置角色后添加上下文为商业知识库,可创建或选择企业内部文档。设置分段参数(分段标识符、最大大小、检索窗口大小、重叠长度)对文档进行分段,分段越精细,知识库回答越精准,设置完成后导入知识库。导入后可进行知识检索测试,若检索不精准,可能需用知识图谱方式微调 参考文章:https://mp.weixin.qq.com/s/cp4rQx09wygE9uHBadI7RA
UP主签名:
作者: 九天Hector
播放量: 21481
发布时间: 2025-03-05 19:33:35
作者: 九天Hector
播放量: 29065
发布时间: 2025-03-07 01:23:44
作者: 程序员码哥
播放量: 4556
发布时间: 2025-03-17 18:45:00
作者: 九天Hector
播放量: 27607
发布时间: 2025-02-26 18:47:43
作者: 人工智能博士
播放量: 40386
发布时间: 2025-03-18 16:08:03
作者: 九天Hector
播放量: 179248
发布时间: 2025-02-27 21:52:44
作者: 九天Hector
播放量: 4200
发布时间: 2025-03-21 03:26:59
作者: 九天Hector
播放量: 40972
发布时间: 2025-03-14 22:19:04
作者: 九天Hector
播放量: 65899
发布时间: 2025-03-09 11:50:00
作者: 跟着小楠学AI
播放量: 1289
发布时间: 2025-02-26 22:20:52
作者: 诸葛小猿
播放量: 632
发布时间: 2025-02-26 23:36:47
作者: ai来事
播放量: 1028
发布时间: 2025-03-10 06:30:00
作者: 九析带你轻松完爆
播放量: 1466
发布时间: 2025-03-06 17:07:15
作者: 大模型入门教程
播放量: 7239
发布时间: 2025-03-21 18:36:26
作者: AI大模型入门指南
播放量: 388
发布时间: 2025-03-14 14:07:03