- 00:33
北大开源!国内首个可复现的RLHF基准【附项目+代码+数据集】_哔哩哔哩_bilibili
- 04:11
AI克隆语音,两大流派,眼见都不一定为实,耳闻就更可能为虚_哔哩哔哩_bilibili
- 13:17
火炉课堂 | 深度学习第二章:机器学习基础_哔哩哔哩_bilibili
- 01:18:36
OpenAI研究员讲解指令微调和RLHF_哔哩哔哩_bilibili
- 12:16
训练企业自己的ChatGPT 使用RLHF训练LLaMA的实践指南_哔哩哔哩_bilibili
- 03:49
Synthesizer V AI 技术预览:使用 RLHF 改进音高生成模型_哔哩哔哩_bilibili
- 03:47
【夏色花梨/小春六花】呜呼ゾンビ乙女 - OIE_哔哩哔哩_bilibili
- 20:07
指令微调_哔哩哔哩_bilibili
- 26:27
Reward Hacking (in RLHF of LLM)_哔哩哔哩_bilibili
- 01:42
1.3 基于人类偏好的强化学习RLHF_哔哩哔哩_bilibili