现代大模型体系化学习
这个专题的第一轮学习围绕三块主线展开:
- 机器学习与深度学习基础
- Transformer 与现代大模型结构
- YOLO 与目标检测
本轮不以训练复杂大模型为目标。学习方式是:先把核心概念讲清楚,再用轻量代码、手算例子或预训练模型验证理解。所有练习默认可以在普通电脑上完成。
为了覆盖现代大模型知识图谱,第一轮会在三条主线中插入必要的前沿指路牌:RAG、LoRA、DPO、MoE、长上下文、多模态、扩散模型、视觉基础模型、推理优化和安全评估。第一轮只要求知道它们的位置和作用,不要求复现或训练。
学习目标与完整大纲以这份文档为准:
学习方式
每一节课按固定结构推进:
- 直觉解释:先知道这个东西解决什么问题。
- 核心概念:再明确关键术语和结构。
- 最小例子:用表格、矩阵、小代码或模型推理验证。
- 理解检查:用几个问题确认是否真正掌握。
- 下一步:只推进一个小台阶。
目录
machine-learning/
00-roadmap/ # 总路线、阶段目标、学习日志
01-ml-dl-basics/ # 机器学习与深度学习基础
02-transformer/ # Transformer 与现代大模型
03-yolo/ # YOLO 与目标检测
notebooks/ # 可选轻量代码实验
papers/ # 论文与阅读笔记
projects/ # 阶段小项目
第一轮目标
完成第一轮后,应当能做到:
- 解释模型、训练、损失函数、梯度下降、过拟合、评估指标。
- 看懂一个基础神经网络或 CNN 的训练流程。
- 解释 Transformer 中 token、embedding、Q/K/V、attention、FFN、residual、LayerNorm 的作用。
- 理解 decoder-only 大语言模型的基本结构、训练后流程和推理流程。
- 解释 YOLO 的输入输出、bounding box、IoU、NMS/NMS-free、mAP 和预训练模型推理流程。
- 知道 RAG、LoRA、DPO、量化、MoE、多模态、扩散模型、SAM、RT-DETR 等现代主题位于知识图谱中的哪一层。