📚 技术学习记录 ·

技术学习记录

强化学习基础

正在初始化搜索引擎

首页
学习路线
2028就业升级导航
知识图谱
学习规划
🧠 AI核心理论
🔧 AI工程与工具
📐 数学与算法
💻 编程语言
🏗️ 系统与架构
☁️ 工程实践
🌐 应用开发
🎓 求职面试
📦 选修

技术学习记录

首页
学习路线
2028就业升级导航
知识图谱
学习规划
🧠 AI核心理论
🔧 AI工程与工具
📐 数学与算法
💻 编程语言
🏗️ 系统与架构
☁️ 工程实践
🌐 应用开发
🎓 求职面试
📦 选修

目录

本章内容

强化学习基础¶

本章内容¶

什么是强化学习
马尔可夫决策过程
贝尔曼方程
动态规划
蒙特卡洛方法
理论基础统一框架
收敛性与复杂度理论
统计学习理论视角

© 2025-2026 技术学习记录 · YZ | 苏ICP备2026009577号-1