- 38:24
大语言模型RLHF算法PPO讲解_哔哩哔哩_bilibili
- 01:45
【夏色花梨】す、好きなんかじゃない!【SYNTHESIZER V COVER】_哔哩哔哩_bilibili
- 24:46
P09 以大型语言模型打造的AI Agent (14_50 教你怎么打造芙莉莲一级魔法使考试中出现的泥人哥列姆) [生成式AI导论 2024 李宏毅]_哔哩哔哩_bilibili
- 17:20
Cross Lingual Machine Reading Comprehension (EMNLP-IJCNLP2019)_哔哩哔哩_bilibili
- 13:38
深度学习12:不发表情不能好好说话之Emoji表情生成器_哔哩哔哩_bilibili
- 01:18:36
OpenAI研究员讲解指令微调和RLHF_哔哩哔哩_bilibili
- 12:16
训练企业自己的ChatGPT 使用RLHF训练LLaMA的实践指南_哔哩哔哩_bilibili
- 00:34
Wombat: 93%ChatGPT性能!无需RLHF就能对齐人类的语言模型_哔哩哔哩_bilibili
- 36:59
【李宏毅2024春最新】第8讲 生成式AI导论(中文)RLHF 大预言模型修炼史(3) by Hung-yi Lee_哔哩哔哩_bilibili
- 31:44
【OpenLLM Talk 016】深度求索MOE;solar10.7B;MOSS RLHF论文;OpenRLHF支持MOE;RM技巧;RLHF的数据规模_哔哩哔哩_bilibili