Civilization Museum
The Dark Forest
标签:
工具 (25)
强化学习 (24)
LLM (22)
NLP (18)
RTOS (16)
图像 (11)
sql (8)
动态规划 (7)
树 (7)
聚类 (6)
线性表 (4)
哈希 (4)
pytorch (4)
huggingface (4)
Python (3)
hive (3)
思考 (2)
排序 (2)
图 (2)
字符串 (2)
二分查找 (2)
数学 (2)
开发 (1)
建站 (1)
推荐 (1)
堆 (1)
海量数据 (1)
风控 (1)
nosql (1)
🪣
十、Actor-Critic Methods
人工智能
|
2025-02-14
强化学习
文章详情
🌋
九、策略梯度方法
人工智能
|
2025-02-14
强化学习
文章详情
📹
八、价值函数近似
人工智能
|
2025-02-14
强化学习
文章详情
🥻
七、时序差分算法
人工智能
|
2025-02-14
强化学习
文章详情
🌍
六、随机近似与随机梯度下降
人工智能
|
2025-02-14
强化学习
文章详情
🎄
五、蒙特卡洛算法
人工智能
|
2025-02-14
强化学习
文章详情
✨
四、价值迭代与策略迭代
人工智能
|
2025-02-14
强化学习
文章详情
🚡
三、最优状态价值与贝尔曼最优性方程
人工智能
|
2025-02-14
强化学习
文章详情
🪝
二、状态价值与贝尔曼公式
人工智能
|
2025-02-14
强化学习
文章详情
🕞
一、强化学习概述
人工智能
|
2025-02-14
强化学习
强化学习概述页面
文章详情
🚉
RLHF:大模型对齐操作
人工智能
|
强化学习
LLM
NLP
文章详情
🏈
[论文] InstructGPT:基于人类反馈训练语言模型遵从指令的能力
人工智能
|
LLM
强化学习
文章详情
1
2
0%