🗄️ 数据库系统学习路径¶
📖 引言¶
🎯 目标受众¶
本学习路径专门为以下开发者设计:
- ✅ 已掌握 Python 编程和深度学习/机器学习基础
- ✅ 有 AI 项目经验,但从未系统学习过数据库
- ✅ 痛点:做项目时不知道何时该用数据库、该用什么数据库
- ✅ 需求:希望系统学习数据库,并能在 AI/ML 项目中熟练应用
- ✅ 目标:掌握关系型和非关系型数据库,能独立设计和优化数据库
💡 为什么 AI/ML 开发者必须学习数据库¶
你的日常场景:
# 场景1: 训练数据管理
# ❌ 错误做法:把所有数据加载到内存
train_data = load_all_data() # 内存爆炸!
# ✅ 正确做法:使用数据库存储和查询
db.query("SELECT * FROM samples WHERE label='cat' LIMIT 1000")
# 场景2: 模型实验追踪
# ❌ 错误做法:用Excel记录实验参数和结果
# ✅ 正确做法:使用数据库存储实验元数据
# 场景3: 模型部署后的预测服务
# ❌ 错误做法:每次预测都重新加载模型
# ✅ 正确做法:数据库缓存预测结果
# 场景4: 大规模AI应用
user_query = "推荐相似商品"
# → 需要从数据库快速检索用户历史、商品信息
学习后的收益: - 🚀 数据管理:高效管理海量训练数据和实验记录 - 📊 特征存储:构建特征平台,加速模型迭代 - 🔧 模型服务:设计高性能的模型推理 API - 🌍 全栈能力:从前端到数据库的完整技术栈 - 🐳 MLOps 基础:模型版本管理、实验追踪的数据库支撑 - ⚡ 性能优化:理解数据库原理,写出高效的 AI 应用 - 🎯 核心目标:能在任何场景选择合适的数据库解决方案
🎯 快速导航:按场景学习¶
不知道从哪里开始?根据你的实际需求选择:
🚨 急需解决问题¶
| 你遇到的问题 | 立即学习章节 | 预计解决时间 |
|---|---|---|
| 完全不懂数据库,从零开始 | 01-数据库基础概念 | 2 小时 |
| 需要写 SQL 查询数据 | 02-SQL 核心语法 | 3 小时 |
| 不知道如何设计表结构 | 03-数据库设计与范式 | 2 小时 |
| 要用 MySQL 做项目 | 04-MySQL 实战 | 4 小时 |
| AI 项目需要存大量非结构化数据 | 06-NoSQL 数据库 | 2 小时 |
| 数据库查询太慢 | 07-数据库优化与调优 | 3 小时 |
| 需要理解事务和并发 | 08-事务与并发控制 | 2 小时 |
| AI 项目的数据库方案设计 | 09-数据库与 AI 应用 | 3 小时 |
| 想做一个完整的数据库项目 | 10-实战项目案例 | 5 小时 |
| Redis 深入学习与面试准备 | 11-Redis 深度专题 | 8 小时 |
| 向量数据库与 RAG 应用 | 12-向量数据库 | 3 小时 |
📚 按学习阶段推荐¶
第一阶段:基础入门( 1 周)
Day 1-2: 01-数据库基础概念 → 理解数据库核心概念
Day 3-5: 02-SQL核心语法 → 掌握SQL查询
Day 6-7: 03-数据库设计与范式 → 学会设计表结构
✅ 里程碑:能用 SQL 完成基本的数据操作,能设计简单的表结构
第二阶段:关系型数据库实战( 1 周)
Day 8-10: 04-MySQL实战 → 掌握最常用的关系型数据库
Day 11-12: 05-PostgreSQL进阶 → 学习高级特性
Day 13-14: 08-事务与并发控制 → 理解数据库核心机制
✅ 里程碑:能独立搭建 MySQL/PostgreSQL ,完成 CRUD 操作
第三阶段:扩展与优化( 1 周)
✅ 里程碑:能根据场景选择合适的数据库类型
第四阶段: AI 应用实战( 1 周)
Day 22-24: 09-数据库与AI应用 → AI场景数据库方案
Day 25-26: 12-向量数据库 → 向量检索与RAG集成
Day 27-28: 10-实战项目案例 → 完成完整项目
✅ 里程碑:能独立设计 AI 项目的数据库架构
第五阶段: Redis 深度专题( 1 周)⭐
✅ 里程碑:精通 Redis 核心原理与实战,能应对大厂面试
🗺️ 完整学习路径¶
┌─────────────────────────────────────────────────────────────────────────────┐
│ 数据库系统完整学习路径 │
├─────────────────────────────────────────────────────────────────────────────┤
│ │
│ 第一阶段:基础入门(第1周) │
│ ┌─────────────────────────────────────────────────────────────────────┐ │
│ │ 01-数据库基础概念 → 02-SQL核心语法 → 03-数据库设计与范式 │ │
│ │ 2-3小时 4-5小时 2-3小时 │ │
│ └─────────────────────────────────────────────────────────────────────┘ │
│ ↓ │
│ 第二阶段:关系型数据库实战(第2周) │
│ ┌─────────────────────────────────────────────────────────────────────┐ │
│ │ 04-MySQL实战 → 05-PostgreSQL进阶 → 08-事务与并发控制 │ │
│ │ 4-5小时 3-4小时 2-3小时 │ │
│ └─────────────────────────────────────────────────────────────────────┘ │
│ ↓ │
│ 第三阶段:扩展与优化(第3周) │
│ ┌─────────────────────────────────────────────────────────────────────┐ │
│ │ 06-NoSQL数据库 → 07-数据库优化与调优 │ │
│ │ 3-4小时 3-4小时 │ │
│ └─────────────────────────────────────────────────────────────────────┘ │
│ ↓ │
│ 第四阶段:AI应用实战(第4周)⭐ │
│ ┌─────────────────────────────────────────────────────────────────────┐ │
│ │ 09-数据库与AI应用 → 12-向量数据库 → 10-实战项目案例 │ │
│ │ 4-5小时 3-4小时 5-6小时 │ │
│ └─────────────────────────────────────────────────────────────────────┘ │
│ ↓ │
│ 第五阶段:Redis深度专题(第5周)⭐⭐ │
│ ┌─────────────────────────────────────────────────────────────────────┐ │
│ │ 11-Redis深度专题(数据结构/持久化/高可用/缓存设计/分布式锁/优化) │ │
│ │ 8-10小时 │ │
│ └─────────────────────────────────────────────────────────────────────┘ │
│ │
└─────────────────────────────────────────────────────────────────────────────┘
📚 章节导航¶
| 章节 | 标题 | 核心内容 | 学习时间 | 前置要求 |
|---|---|---|---|---|
| 01 | 数据库基础概念 | 数据库核心概念、关系型 vs 非关系型、基础术语 | 2-3 小时 | 无 |
| 02 | SQL 核心语法 | SELECT/INSERT/UPDATE/DELETE 、 JOIN 、子查询、聚合函数 | 4-5 小时 | 01 章 |
| 03 | 数据库设计与范式 | ER 模型、三大范式、反范式设计、索引设计 | 2-3 小时 | 01-02 章 |
| 04 | MySQL 实战 | 安装配置、数据类型、存储引擎、 Python 操作 | 4-5 小时 | 01-03 章 |
| 05 | PostgreSQL 进阶 | JSON 处理、全文搜索、窗口函数、高级索引 | 3-4 小时 | 04 章 |
| 06 | NoSQL 数据库 | MongoDB 文档操作、 Redis 缓存、向量数据库 | 3-4 小时 | 01 章 |
| 07 | 数据库优化与调优 | EXPLAIN 分析、索引优化、配置调优、连接池、缓存策略 | 3-4 小时 | 04-06 章 |
| 08 | 事务与并发控制 | ACID 特性、隔离级别、锁机制、死锁处理 | 2-3 小时 | 04 章 |
| 09 | 数据库与 AI 应用 ⭐ | 特征存储、向量数据库、 MLOps 数据管理、数据流水线 | 4-5 小时 | 01-08 章 |
| 10 | 实战项目案例 ⭐ | 电商分析系统、推荐系统、 MLOps 平台 | 5-6 小时 | 全部章节 |
| 11 | Redis 深度专题 ⭐ | 数据结构底层、持久化、集群架构、缓存设计、分布式锁、性能优化 | 8-10 小时 | 06 章 |
| 12 | 向量数据库 ⭐ | 向量索引算法、 Milvus 实战、 RAG 集成、混合检索、性能优化 | 3-4 小时 | 09 章 |
🎯 学习目标与检验标准¶
完成本学习路径后,你将能够¶
基础能力(必须掌握) - ✅ 理解关系型和非关系型数据库的区别 - ✅ 熟练使用 SQL 进行数据查询和操作 - ✅ 能够设计符合范式的数据库表结构 - ✅ 能在本地安装和配置 MySQL/PostgreSQL - ✅ 能用 Python 操作数据库
进阶能力(推荐掌握) - ✅ 理解索引原理,能进行查询优化 - ✅ 掌握事务和并发控制机制 - ✅ 能使用 MongoDB 和 Redis - ✅ 能分析慢查询并进行优化
实战能力(挑战目标) - ✅ 独立设计AI 项目的数据库架构 - ✅ 能选择合适的数据库类型解决特定问题 - ✅ 能搭建完整的 AI 应用数据层
AI 专项能力(核心目标) - ✅ 设计训练数据管理方案 - ✅ 实现特征存储系统 - ✅ 搭建模型实验追踪平台 - ✅ 构建高性能的模型服务 API
🎥 视频教程链接¶
中文视频教程¶
B 站推荐¶
💡 以下为推荐的搜索关键词,请在 B 站直接搜索获取最新内容。
推荐搜索关键词: - "MySQL 入门教程 2024"、"SQL 基础语法" - "PostgreSQL 教程"、"Redis 入门到精通" - "数据库原理 讲解"、"事务与索引 详解" - "MongoDB 教程"、"数据库面试题"
国内 MOOC 平台¶
💡 以下为推荐平台,请在平台内搜索相关课程名称。
英文视频教程¶
YouTube 优质频道¶
- FreeCodeCamp SQL - SQL 完整教程
- Programming with Mosh SQL - SQL 快速入门
- Tech With Tim Database - 数据库实战
- MySQL Tutorial - MySQL 官方教程
- PostgreSQL Tutorial - PostgreSQL 教程
Coursera 课程¶
- SQL for Data Science - SQL 数据科学
- Databases and SQL for Data Science - SQL 与 Python
- Database Management Essentials - 数据库管理
Udemy 课程¶
- The Complete SQL Bootcamp - SQL 完整指南
- MySQL Database Administration - MySQL 数据库管理
- MongoDB - The Complete Developer's Guide - MongoDB 开发指南
edX 课程¶
- MIT 6.830: Database Systems - MIT 数据库系统
- Stanford CS145: Introduction to Databases - 斯坦福数据库入门
💻 在线练习平台¶
代码练习平台¶
SQL 专项¶
- SQL Zoo - SQL 互动练习
- LeetCode Database - LeetCode SQL 题目
- HackerRank SQL - HackerRank SQL 练习
- SQL Fiddle - SQL 在线运行环境
- Mode Analytics SQL Tutorial - SQL 教程
数据库专项¶
- MySQL Tutorial - MySQL 教程和练习
- PostgreSQL Tutorial - PostgreSQL 教程
- MongoDB University - MongoDB 官方课程
- Redis University - Redis 官方课程
项目实战平台¶
开源项目¶
- GitHub - 全球最大的开源代码托管平台
- GitLab - 开源项目协作平台
- Gitee - 国内开源代码托管平台
- Awesome SQL - SQL 优秀资源
互动学习平台¶
数据库学习¶
- SQL Zoo - SQL 互动练习
- Khan Academy SQL - SQL 基础教程
- Coursera - 在线课程平台
- edX - 免费在线课程
🚀 开始学习¶
4 种学习路径,选择适合你的¶
路径 A :系统学习(推荐)
适合时间充裕,希望打好基础的学习者
路径 B :快速上手
适合急需解决问题,时间紧张的学习者
路径 C :项目驱动
适合喜欢动手实践的学习者
路径 D : AI 专项
适合已有基础,专注 AI 应用的学习者
📞 学习支持与资源¶
推荐学习资源¶
官方文档(最权威) - MySQL 官方文档 - PostgreSQL 官方文档 - MongoDB 官方文档 - Redis 官方文档
推荐书籍 - 《 SQL 必知必会》- 入门经典 - 《高性能 MySQL 》- 进阶必读 - 《 Redis 设计与实现》- 深入理解 Redis - 《 MongoDB 权威指南》- NoSQL 实战
在线练习 - SQLBolt - 交互式 SQL 学习 - LeetCode 数据库题 - SQL 练习 - Mode Analytics SQL 教程 - 实战导向
AI 相关资源 - MLflow 文档 - 实验追踪 - ClearML 文档 - 企业级 MLOps 平台 - Arize AI - 模型监控与可观测性 - Feast 文档 - 特征存储 - pgvector 文档 - 向量数据库 - Milvus 文档 - 分布式向量数据库 - HikariCP - 高性能连接池
📝 版本信息¶
v1.2 (2026-02-12) - AI 开发者数据库专项版( 2025 更新) - ✨ 初始版本发布:完整的 12 章节学习路径 - ✨ AI 专项:第 9 章专为 AI 场景设计 - ✨ 实战导向:第 10 章包含 3 个完整项目 - ✨ 循序渐进:从基础到实战的完整路径 - ✨ 场景化学习:支持按问题快速定位章节 - 🆕 2025 年更新: - pgvector 0.8.0 新特性(支持 16000 维向量) - 特征存储行业案例( Uber 、 DoorDash 、 Netflix ) - MLOps 最新工具( Arize AI 、 Galileo 、 ClearML ) - 连接池最佳实践( HikariCP )
推荐:从 01-数据库基础概念 开始系统学习
然后根据你的目标选择起点: - 零基础系统学习 → 01-数据库基础概念 - 急需写 SQL → 02-SQL 核心语法 - AI 项目数据库设计 → 09-数据库与 AI 应用 - 想做完整项目 → 10-实战项目案例
最后更新日期: 2026-02-12 适用版本:数据库教程 v2026