成本报告模板¶
目标:把“能跑”升级成“值得长期运行”。
一、至少要拆的成本维度¶
- 计算成本
- 存储成本
- 模型/API 调用成本
- 缓存与带宽成本
- 运维与观测成本
二、推荐结构¶
Markdown
# 成本报告
## 1. 成本范围
- 时间范围:
- 环境:开发 / 测试 / 生产
## 2. 成本拆分
| 项目 | 单位成本 | 用量 | 月成本 |
|------|----------|------|--------|
| | | | |
## 3. 单请求成本
| 场景 | 成本 |
|------|------|
| 冷启动 | |
| 热缓存 | |
| 高峰期 | |
## 4. 优化动作
| 动作 | 节省了什么 | 副作用 |
|------|------------|--------|
| | | |
## 5. 容量与预算
- 当前容量:
- 安全余量:
- 预算上限:
- 超预算预案:
三、面试时必须能回答¶
- 单请求成本是多少
- 高峰期成本会不会失控
- 缓存/量化/路由各自节省了什么
- 用更便宜的方案会丢掉什么