# 现代大模型体系化学习

这个专题的第一轮学习围绕三块主线展开：

1. 机器学习与深度学习基础
2. Transformer 与现代大模型结构
3. YOLO 与目标检测

本轮不以训练复杂大模型为目标。学习方式是：先把核心概念讲清楚，再用轻量代码、手算例子或预训练模型验证理解。所有练习默认可以在普通电脑上完成。

为了覆盖现代大模型知识图谱，第一轮会在三条主线中插入必要的前沿指路牌：RAG、LoRA、DPO、MoE、长上下文、多模态、扩散模型、视觉基础模型、推理优化和安全评估。第一轮只要求知道它们的位置和作用，不要求复现或训练。

学习目标与完整大纲以这份文档为准：

- [学习目标与大纲](00-roadmap/learning-goals-and-syllabus.md)
- [文档审计记录](00-roadmap/audit-2026-06-05.md)
- [学习过程记录规范](00-roadmap/session-recording-policy.md)
- [学习日志](00-roadmap/learning-log.md)
- [当前学习状态](00-roadmap/current-state.md)

## 学习方式

每一节课按固定结构推进：

1. 直觉解释：先知道这个东西解决什么问题。
2. 核心概念：再明确关键术语和结构。
3. 最小例子：用表格、矩阵、小代码或模型推理验证。
4. 理解检查：用几个问题确认是否真正掌握。
5. 下一步：只推进一个小台阶。

## 目录

```text
machine-learning/
  00-roadmap/              # 总路线、阶段目标、学习日志
  01-ml-dl-basics/         # 机器学习与深度学习基础
  02-transformer/          # Transformer 与现代大模型
  03-yolo/                 # YOLO 与目标检测
  notebooks/               # 可选轻量代码实验
  papers/                  # 论文与阅读笔记
  projects/                # 阶段小项目
```

## 第一轮目标

完成第一轮后，应当能做到：

- 解释模型、训练、损失函数、梯度下降、过拟合、评估指标。
- 看懂一个基础神经网络或 CNN 的训练流程。
- 解释 Transformer 中 token、embedding、Q/K/V、attention、FFN、residual、LayerNorm 的作用。
- 理解 decoder-only 大语言模型的基本结构、训练后流程和推理流程。
- 解释 YOLO 的输入输出、bounding box、IoU、NMS/NMS-free、mAP 和预训练模型推理流程。
- 知道 RAG、LoRA、DPO、量化、MoE、多模态、扩散模型、SAM、RT-DETR 等现代主题位于知识图谱中的哪一层。