作者:九天Hector
观看:30,485次
弹幕:152
上传时间:2023-06-16
相关: 原理 微调 GPT LoRA 高效微调 大语言模型 RLHF Prefix-Tuning Prompt-Tuning P-Tuning v2
作者:大模型解码室
观看:6,212次
弹幕:5
上传时间:2024-06-17
相关: 强化学习 nlp Actor Model RLHF原理 Reference Model Critic Model Reward Model
作者:GenJi是真想教会你
观看:384,309次
弹幕:1,555
上传时间:2024-03-02
相关: 模型 人工智能 AI 原理 机器学习 深度学习 AI大模型 ChatGPT 大语言模型 2023年度科技榜单 2024bilibili迎春会