返回

README.md

2.4 KB · MD · 2026-06-05 06:03

现代大模型体系化学习

这个专题的第一轮学习围绕三块主线展开：

机器学习与深度学习基础
Transformer 与现代大模型结构
YOLO 与目标检测

本轮不以训练复杂大模型为目标。学习方式是：先把核心概念讲清楚，再用轻量代码、手算例子或预训练模型验证理解。所有练习默认可以在普通电脑上完成。

为了覆盖现代大模型知识图谱，第一轮会在三条主线中插入必要的前沿指路牌：RAG、LoRA、DPO、MoE、长上下文、多模态、扩散模型、视觉基础模型、推理优化和安全评估。第一轮只要求知道它们的位置和作用，不要求复现或训练。

学习目标与完整大纲以这份文档为准：

学习方式

每一节课按固定结构推进：

直觉解释：先知道这个东西解决什么问题。
核心概念：再明确关键术语和结构。
最小例子：用表格、矩阵、小代码或模型推理验证。
理解检查：用几个问题确认是否真正掌握。
下一步：只推进一个小台阶。

目录

machine-learning/
  00-roadmap/              # 总路线、阶段目标、学习日志
  01-ml-dl-basics/         # 机器学习与深度学习基础
  02-transformer/          # Transformer 与现代大模型
  03-yolo/                 # YOLO 与目标检测
  notebooks/               # 可选轻量代码实验
  papers/                  # 论文与阅读笔记
  projects/                # 阶段小项目

第一轮目标

完成第一轮后，应当能做到：

解释模型、训练、损失函数、梯度下降、过拟合、评估指标。
看懂一个基础神经网络或 CNN 的训练流程。
解释 Transformer 中 token、embedding、Q/K/V、attention、FFN、residual、LayerNorm 的作用。
理解 decoder-only 大语言模型的基本结构、训练后流程和推理流程。
解释 YOLO 的输入输出、bounding box、IoU、NMS/NMS-free、mAP 和预训练模型推理流程。
知道 RAG、LoRA、DPO、量化、MoE、多模态、扩散模型、SAM、RT-DETR 等现代主题位于知识图谱中的哪一层。