大模型应用开发 - 详细学习指南¶

⚠️ 时效性说明：本章涉及前沿模型/价格/榜单等信息，可能随版本快速变化；请以论文原文、官方发布页和 API 文档为准。

📚 学习总览¶

本指南为清华大学计算机技术专业专硕及 985 AI 专业本科生量身定制,提供系统性的大模型应用开发学习路径。目标是帮助你在 16-20 周内掌握大模型应用开发的核心理论和工程实践能力,为进入字节跳动、腾讯、阿里巴巴、百度、大疆、影石等互联网大厂做好准备。

🎯 学习目标¶

短期目标(1-3 个月)¶

掌握大模型应用开发基础理论
能够使用 Prompt 工程进行应用开发
完成 2-3 个小型实战项目

中期目标(3-6 个月)¶

深入理解 RAG 系统和 Agent 开发
能够独立设计和实现大模型应用
完成 1-2 个中型实战项目

长期目标(6 个月+)¶

掌握大模型前沿技术
具备解决复杂大模型应用问题的能力
完成 1 个大型实战项目
通过大厂面试

📅 详细学习计划¶

第一阶段:基础夯实(第 1-3 周)¶

第 1 周:大模型应用概述¶

学习内容: - 01-大模型应用概述.md - 大模型发展历程(1 天) - 主流大模型介绍(2 天) - 大模型应用场景(2 天) - 环境搭建与第一个 Demo(2 天)

学习时间:每天 3-4 小时,总计 20-25 小时

第 2 周:Prompt 工程¶

学习内容: - 02-Prompt 工程.md - Prompt 基础(2 天) - Prompt 设计技巧(2 天) - Prompt 优化方法(2 天) - 实战:Prompt 工程实践(1 天)

学习时间:每天 3-4 小时,总计 20-25 小时

第 3 周:上下文学习¶

学习内容: - 03-上下文学习.md - 上下文学习原理(2 天) - Few-shot Learning(2 天) - Zero-shot Learning(2 天) - 实战:上下文学习应用(1 天)

学习时间:每天 3-4 小时,总计 20-25 小时

第二阶段:核心应用(第 4-8 周)¶

第 4 周:思维链与推理¶

学习内容: - 04-思维链与推理.md - 思维链概述(1 天) - CoT 技术(2 天) - 推理优化(2 天) - 实战:思维链应用(2 天)

学习时间:每天 3-4 小时,总计 20-25 小时

第 5 周:RAG 系统构建¶

学习内容: - 05-RAG 系统构建.md - RAG 概述(1 天) - 文档检索(2 天) - 知识库构建(2 天) - 实战:RAG 系统实现(2 天)

学习时间:每天 3-4 小时,总计 20-25 小时

第 6 周:向量数据库¶

学习内容: - 06-向量数据库.md - 向量数据库概述(1 天) - Embedding 技术(2 天) - 向量检索(2 天) - 实战:向量数据库应用(2 天)

学习时间:每天 3-4 小时,总计 20-25 小时

第 7 周:Agent 开发基础¶

学习内容: - 07-Agent 开发基础.md - Agent 概述(1 天) - Agent 架构(2 天) - Agent 工具(2 天) - 实战:简单 Agent 实现(2 天)

学习时间:每天 3-4 小时,总计 20-25 小时

第 8 周:LangChain 框架¶

学习内容: - 08-LangChain-LCEL 框架.md - LangChain 概述(1 天) - LangChain 核心组件(2 天) - LangChain 应用开发(2 天) - 实战:LangChain 项目(2 天)

学习时间:每天 3-4 小时,总计 20-25 小时

第三阶段:进阶技术(第 9-12 周)¶

第 9 周:大模型微调技术¶

学习内容: - 09-大模型微调技术.md - 微调概述(1 天) - 全量微调(2 天) - 参数高效微调(2 天) - 实战:微调实践(2 天)

学习时间:每天 3-4 小时,总计 20-25 小时

第 10 周:LoRA 与 QLoRA¶

学习内容: - 10-LoRA 与 QLoRA.md - LoRA 原理(2 天) - QLoRA 技术(2 天) - 微调实践(2 天) - 实战:LoRA 应用(1 天)

学习时间:每天 3-4 小时,总计 20-25 小时

第 11 周:大模型部署¶

学习内容: - 11-大模型部署.md - 部署概述(1 天) - 模型量化(2 天) - 推理优化(2 天) - 实战:模型部署(2 天)

学习时间:每天 3-4 小时,总计 20-25 小时

第 12 周:推理优化¶

学习内容: - 12-推理优化.md - 推理优化概述(1 天) - KV Cache(2 天) - 批处理优化(2 天) - 实战:推理优化实践(2 天)

学习时间:每天 3-4 小时,总计 20-25 小时

第四阶段:前沿应用(第 13-15 周)¶

第 13 周:多模态应用¶

学习内容: - 13-多模态应用.md - 多模态概述(1 天) - 图文理解(2 天) - 多模态生成(2 天) - 实战:多模态应用(2 天)

学习时间:每天 3-4 小时,总计 20-25 小时

第 14 周:大模型安全与对齐¶

学习内容: - 14-大模型安全与对齐.md - 安全概述(1 天) - 对齐技术(2 天) - 安全防护(2 天) - 实战:安全应用(2 天)

学习时间:每天 3-4 小时,总计 20-25 小时

第 15 周:大模型应用案例¶

学习内容: - 15-大模型应用案例.md - 案例分析(2 天) - 最佳实践(2 天) - 项目实战(3 天)

学习时间:每天 3-4 小时,总计 20-25 小时

第五阶段:实战项目(第 16-20 周)¶

第 16-17 周:项目 1-RAG 问答系统¶

学习内容: - 实战项目/01-RAG 知识库问答系统.md - 项目需求分析(2 天) - 知识库构建(3 天) - RAG 系统实现(4 天) - 系统优化与部署(3 天)

学习时间:每天 4-5 小时,总计 48-60 小时

第 18-19 周:项目 2-AI Agent 系统¶

学习内容: - 实战项目/02-AI Agent 工作流.md - 项目需求分析(2 天) - Agent 设计(3 天) - Agent 实现(4 天) - 系统集成与部署(3 天)

学习时间:每天 4-5 小时,总计 48-60 小时

第 20 周:项目 3-多模态应用¶

学习内容: - 实战项目/03-多模态应用.md - 项目需求分析(1 天) - 多模态模型集成(2 天) - 应用开发(3 天) - 系统部署(2 天)

学习时间:每天 4-5 小时,总计 32-40 小时

第六阶段:面试准备(第 21-24 周)¶

第 21 周:算法题库¶

学习内容: - 面试准备/README.md （算法题库部分） - 大模型算法题(2 天) - 系统设计基础(2 天) - 编程题(2 天) - 刷题练习(1 天)

学习时间:每天 3-4 小时,总计 20-25 小时

第 22 周:系统设计与项目经验¶

学习内容: - 面试准备/README.md （系统设计与项目经验部分） - 大模型系统设计(2 天) - 项目经验梳理(2 天) - 技术难点准备(2 天) - 模拟面试(1 天)

学习时间:每天 3-4 小时,总计 20-25 小时

第 23-24 周:大厂面试准备¶

学习内容: - 面试准备/README.md （大厂面试与行为面试部分） - 字节跳动面试题(2 天) - 腾讯面试题(2 天) - 阿里巴巴面试题(2 天) - 百度面试题(2 天) - 综合复习与模拟面试(4 天)

学习时间:每天 3-4 小时,总计 48-60 小时

📊 学习进度跟踪¶

进度检查点¶

第 3 周末: - [ ] 完成基础理论学习 - [ ] 运行第一个大模型 Demo - [ ] 完成 Prompt 工程实践

第 8 周末: - [ ] 理解 RAG 和 Agent 核心原理 - [ ] 完成 RAG 系统项目 - [ ] 完成 Agent 项目

第 12 周末: - [ ] 掌握微调和部署技术 - [ ] 完成微调实践 - [ ] 完成模型部署

第 15 周末: - [ ] 了解前沿技术 - [ ] 完成多模态应用 - [ ] 形成技术知识体系

第 20 周末: - [ ] 完成 3 个完整实战项目 - [ ] 具备独立开发能力 - [ ] 准备好面试

第 24 周末: - [ ] 完成所有面试准备 - [ ] 通过模拟面试 - [ ] 准备好求职

💡 学习方法建议¶

1. 理论学习¶

先理解后记忆:不要死记硬背,理解原理更重要
画图辅助:用图示帮助理解复杂概念
联系实际:将理论与实际应用联系起来

2. 代码实践¶

从零实现:关键算法要自己实现一遍
阅读源码:学习优秀开源项目的代码
调试技巧:掌握调试和问题排查方法

3. 项目开发¶

完整流程:从需求到部署完整实践
迭代优化:不断改进和优化
文档编写:养成良好的文档习惯

4. 面试准备¶

系统复习:定期复习核心知识
刷题练习:LeetCode 、牛客网等
模拟面试:进行多次模拟面试

5. 持续学习¶

关注前沿:阅读最新论文和博客
参与社区:加入技术社区交流
分享输出:写博客、做分享

❓ 常见问题解答¶

Q1: 学习时间不够怎么办¶

A: - 优先学习核心章节(01-08 章) - 其他章节可以根据兴趣选择 - 重点掌握 Prompt 工程、 RAG 、 Agent - 利用碎片时间学习

Q2: 没有 GPU 怎么办¶

A: - 使用 Google Colab 免费 GPU - 使用 Kaggle Kernels - 使用学校/实验室资源 - 先学习理论知识,后期再实践

Q3: 数学基础薄弱怎么办¶

A: - 边学边补,在实践中理解 - 推荐《深度学习》第 2-4 章 - 观看 3Blue1Brown 的数学视频 - 多做练习题巩固

Q4: 如何选择大模型¶

A: - GPT 系列:通用能力强,适合大多数场景 - Claude:长文本处理能力强 - 开源模型:成本可控,可私有部署 - 建议:根据需求选择合适模型

Q5: 实战项目太难怎么办¶

A: - 从简单项目开始 - 参考开源项目,理解后再自己实现 - 分阶段完成,逐步增加难度 - 遇到问题及时求助

Q6: 如何准备大厂面试¶

A: - 系统学习面试准备目录 - 多刷 LeetCode 相关题目 - 准备 2-3 个深度项目 - 进行多次模拟面试 - 了解目标公司和岗位

Q7: 学习过程中遇到困难怎么办¶

A: - 查阅官方文档和教程 - 在 Stack Overflow 搜索 - 加入技术社区提问 - 向同学、导师请教 - 不要放弃,持续努力

Q8: 如何平衡学习和求职¶

A: - 制定合理的学习计划 - 优先学习核心知识 - 边学习边准备面试 - 项目经验很重要 - 保持积极心态

🎥 视频教程链接¶

中文视频教程¶

B 站推荐¶

💡 以下为推荐的 UP 主和搜索关键词，请在 B 站直接搜索获取最新内容。

推荐 UP 主（在 B 站搜索其名称即可找到）： - 李沐 - 论文精读系列（ RAG 、 Agent 等前沿论文） - 跟李沐学 AI - 大模型应用相关论文精读

推荐搜索关键词： - "Prompt 工程实战"、"RAG 系统构建" - "LangChain 教程"、"Agent 开发入门" - "大模型微调 LoRA"、"向量数据库教程" - "LLM 应用开发实战"

国内 MOOC 平台¶

💡 以下为推荐平台，请在平台内搜索相关课程名称。

中国大学 MOOC - 搜索"人工智能"、"自然语言处理"
学堂在线 - 搜索"大模型应用"、"自然语言处理"
网易公开课 - 搜索"大模型"、"AI 应用"

英文视频教程¶

YouTube 优质频道¶

LangChain 官方 - LangChain 官方教程
OpenAI Developers - OpenAI 官方开发教程
Hugging Face - Hugging Face NLP 课程
DeepLearning.AI - Andrew Ng 的深度学习课程
AssemblyAI - NLP 和语音识别教程

💻 在线练习平台¶

LLM 应用开发实践平台¶

LangChain 官方文档 - LangChain 框架学习和实践
LlamaIndex 官方文档 - RAG 系统构建实践
Hugging Face Course - NLP 和 Transformers 实践课程
Google Colab - 免费 GPU 环境，适合 LLM 应用实验

LLM 应用开发课程¶

Coursera - 搜索"Generative AI with LLMs"、"Prompt Engineering"等课程
Udemy - 搜索"LangChain"、"RAG Applications"等课程
Fast.AI - 实用导向的深度学习和 NLP 课程
edX - MIT/Stanford AI 免费课程

📚 推荐学习资源¶

在线课程¶

CS224N - Stanford
Deep Learning Specialization - Coursera
Prompt Engineering Guide - OpenAI

书籍¶

《深度学习》- Ian Goodfellow
《注意力机制》- Vaswani et al.
《大模型应用开发实战》

论文¶

arXiv cs.CL
Papers with Code
Hugging Face Papers

开源项目¶

LangChain
LlamaIndex
AutoGPT
Hugging Face Transformers

🚀 开始学习¶

现在你已经了解了完整的学习路径,让我们开始大模型应用开发的学习之旅吧!

第一步:阅读01-大模型应用概述.md

记住:学习是一个持续的过程,保持耐心和坚持,你一定能够成功!

祝学习顺利,早日实现大厂梦想! 💪

📚 参考文献¶

核心论文¶

Prompt 工程¶

Language Models are Few-Shot Learners - Brown et al., 2020
GPT-3 论文，展示了大模型的 few-shot 能力
Chain-of-Thought Prompting Elicits Reasoning in Large Language Models - Wei et al., 2022
思维链（ CoT ）提示方法
Large Language Models Are Zero-Shot Reasoners - Kojima et al., 2022
Zero-shot-CoT 方法
Tree of Thoughts: Deliberate Problem Solving with Large Language Models - Yao et al., 2023
思维树（ ToT ）框架

RAG 系统¶

Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks - Lewis et al., 2020
RAG 开山之作
Dense Passage Retrieval for Open-Domain Question Answering - Karpukhin et al., 2020
DPR ，密集检索方法
Improving Dense Retrieval with Contrastive Learning - Qu et al., 2022
对比学习改进检索
HyDE: Precise Answer Generation via Retrieval from Hypothetical Document Embeddings - Gao et al., 2022
假设文档嵌入方法

Agent 开发¶

ReAct: Synergizing Reasoning and Acting in Language Models - Yao et al., 2022
ReAct 框架，推理与行动结合
Reflexion: Language Agents with Verbal Reinforcement Learning - Shinn et al., 2023
- 反思机制
AutoGPT: An Autonomous GPT-4 Agent - Significant Gravitas, 2023
- 自主 Agent 框架
BabyAGI: A Task-Driven Autonomous Agent - Yohei Nakajima, 2023
- 任务驱动的自主 Agent

微调与部署¶

LoRA: Low-Rank Adaptation of Large Language Models - Hu et al., 2021
- 低秩适配技术
QLoRA: Efficient Finetuning of Quantized LLMs - Dettmers et al., 2023
- 量化感知的 LoRA
vLLM: Easy, Fast, and Cheap LLM Serving - Kwon et al., 2023
- 高效推理服务

技术博客¶

中文博客¶

LangChain 中文文档 - LangChain 官方中文文档
LlamaIndex 中文文档 - LlamaIndex 中文文档
Hugging Face 中文博客 - Hugging Face 官方中文博客
深度学习自然语言处理 - NLP 技术分享
机器之心 - AI 行业媒体

英文博客¶

LangChain Blog - LangChain 官方博客
LlamaIndex Blog - LlamaIndex 官方博客
OpenAI Blog - OpenAI 官方博客
Anthropic Blog - Anthropic 研究博客
Jay Alammar's Blog - 可视化理解技术

开源项目¶

应用框架¶

LangChain - LLM 应用开发框架
LlamaIndex - 数据框架，构建 LLM 应用
Semantic Kernel - 微软 LLM 应用 SDK
Haystack - NLP 应用框架
AutoGen - 微软多 Agent 框架

RAG 系统¶

LangChain RAG - LangChain RAG 实现
LlamaIndex RAG - LlamaIndex RAG
Verba - Weaviate 的 RAG 演示
PrivateGPT - 私有化 GPT
GPT-RAG - Amazon 的 RAG 框架

Agent 框架¶

AutoGPT - 自主 AI 智能体
BabyAGI - 任务驱动 Agent
CrewAI - 多 Agent 协作框架
LangChain Agents - LangChain Agent
MetaGPT - 多角色 Agent 框架

向量数据库¶

Chroma - 开源向量数据库
Weaviate - AI 原生向量数据库
Qdrant - 高性能向量数据库
Milvus - 开源向量数据库
FAISS - Facebook 相似性搜索库

参考书籍¶

中文书籍¶

《大模型应用开发实战》- 机械工业出版社
大模型应用开发实践指南
《 LangChain 实战：构建大语言模型应用》- 电子工业出版社
LangChain 框架实战教程
《自然语言处理综论》- Daniel Jurafsky 、 James H. Martin 著，电子工业出版社
NLP 领域的经典教材
《深度学习》- Ian Goodfellow 、 Yoshua Bengio 、 Aaron Courville 著，人民邮电出版社
深度学习领域的"圣经"
《动手学深度学习》- 李沐、阿斯顿·张著，人民邮电出版社
实践导向的深度学习教程
《 Python 深度学习》- François Chollet 著，人民邮电出版社
Keras 作者撰写的深度学习实践指南
《机器学习实战：基于 Scikit-Learn 、 Keras 和 TensorFlow 》- Aurélien Géron 著，机械工业出版社
机器学习实践指南
《强化学习》- Richard S. Sutton 、 Andrew G. Barto 著，电子工业出版社
强化学习领域的奠基之作

英文书籍¶

"Natural Language Processing with Transformers" - Lewis Tunstall, Leandro von Werra, Thomas Wolf
O'Reilly ， Transformer 实战指南
"Designing Machine Learning Systems" - Chip Huyen
O'Reilly ，机器学习系统设计
"Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow" - Aurélien Géron
O'Reilly ，机器学习实践指南
"Building AI Applications with LangChain" - Denis Rothman
Packt ， LangChain 应用开发
"Prompt Engineering for Generative AI" - James Phoenix
Packt ，提示词工程
"Large Language Models: Concepts, Architecture, and Applications" - Soma Halder
Packt ，大模型应用
"Reinforcement Learning: An Introduction" - Richard S. Sutton, Andrew G. Barto
MIT Press ，强化学习奠基之作
"Python Machine Learning" - Sebastian Raschka, Vahid Mirjalili
Packt ， Python 机器学习实践

在线课程¶

中文课程¶

💡 中文视频教程推荐请参见上方视频教程链接章节。

英文课程¶

LangChain for LLM Application Development (Udemy) - LangChain 应用开发
Complete Guide to Building RAG Applications (Udemy) - RAG 系统完整指南
Prompt Engineering for ChatGPT (Udemy) - ChatGPT 提示词工程
Generative AI with Large Language Models (Coursera) - 大模型生成式 AI
ChatGPT Prompt Engineering for Developers (Coursera) - 提示词工程

社区资源¶

中文社区¶

LangChain 中文社区 - LangChain 中文文档
Hugging Face 中文社区 - 模型和数据集分享
机器之心 - AI 行业媒体
量子位 - AI 前沿资讯
Datawhale - 开源学习社区

英文社区¶

LangChain Discord - LangChain 社区
LlamaIndex Discord - LlamaIndex 社区
OpenAI Community - OpenAI 社区
Hugging Face Forum - Hugging Face 讨论区
Reddit r/LangChain - LangChain 讨论

论坛与问答¶

Stack Overflow LangChain - LangChain 技术问答
Stack Overflow RAG - RAG 技术问答
GitHub Discussions - LangChain 讨论
Hugging Face Forum - Hugging Face 讨论区

邮件列表与 Slack¶

LangChain Discord - LangChain 社区
LlamaIndex Discord - LlamaIndex 社区
OpenAI Community - OpenAI 社区

最后更新日期： 2026-02-12 适用版本： LLM 应用指南 v2026

大模型应用开发 - 详细学习指南¶

📚 学习总览¶

🎯 学习目标¶

短期目标(1-3 个月)¶

中期目标(3-6 个月)¶

长期目标(6 个月+)¶

📅 详细学习计划¶

第一阶段:基础夯实(第 1-3 周)¶

第 1 周:大模型应用概述¶

第 2 周:Prompt 工程¶

第 3 周:上下文学习¶

第二阶段:核心应用(第 4-8 周)¶

第 4 周:思维链与推理¶

第 5 周:RAG 系统构建¶

第 6 周:向量数据库¶

第 7 周:Agent 开发基础¶

第 8 周:LangChain 框架¶

第三阶段:进阶技术(第 9-12 周)¶

第 9 周:大模型微调技术¶

第 10 周:LoRA 与 QLoRA¶

第 11 周:大模型部署¶

第 12 周:推理优化¶

第四阶段:前沿应用(第 13-15 周)¶

第 13 周:多模态应用¶

第 14 周:大模型安全与对齐¶

第 15 周:大模型应用案例¶

第五阶段:实战项目(第 16-20 周)¶

第 16-17 周:项目 1-RAG 问答系统¶

第 18-19 周:项目 2-AI Agent 系统¶

第 20 周:项目 3-多模态应用¶

第六阶段:面试准备(第 21-24 周)¶

第 21 周:算法题库¶

第 22 周:系统设计与项目经验¶

第 23-24 周:大厂面试准备¶

📊 学习进度跟踪¶

进度检查点¶

💡 学习方法建议¶

1. 理论学习¶

2. 代码实践¶

3. 项目开发¶

4. 面试准备¶

5. 持续学习¶

❓ 常见问题解答¶

Q1: 学习时间不够怎么办¶

Q2: 没有 GPU 怎么办¶

Q3: 数学基础薄弱怎么办¶

Q4: 如何选择大模型¶

Q5: 实战项目太难怎么办¶

Q6: 如何准备大厂面试¶

Q7: 学习过程中遇到困难怎么办¶

Q8: 如何平衡学习和求职¶

🎥 视频教程链接¶

中文视频教程¶

B 站推荐¶

国内 MOOC 平台¶

英文视频教程¶

YouTube 优质频道¶

Coursera 课程¶

Udemy 课程¶

edX 课程¶

💻 在线练习平台¶

LLM 应用开发实践平台¶

LLM 应用开发课程¶

📚 推荐学习资源¶

在线课程¶

书籍¶

论文¶

开源项目¶

🚀 开始学习¶

📚 参考文献¶

核心论文¶

Prompt 工程¶

RAG 系统¶

Agent 开发¶

微调与部署¶

技术博客¶

中文博客¶

英文博客¶

开源项目¶

应用框架¶