返回

README.md

2.4 KB · MD · 2026-06-05 06:03

现代大模型体系化学习

这个专题的第一轮学习围绕三块主线展开:

  1. 机器学习与深度学习基础
  2. Transformer 与现代大模型结构
  3. YOLO 与目标检测

本轮不以训练复杂大模型为目标。学习方式是:先把核心概念讲清楚,再用轻量代码、手算例子或预训练模型验证理解。所有练习默认可以在普通电脑上完成。

为了覆盖现代大模型知识图谱,第一轮会在三条主线中插入必要的前沿指路牌:RAG、LoRA、DPO、MoE、长上下文、多模态、扩散模型、视觉基础模型、推理优化和安全评估。第一轮只要求知道它们的位置和作用,不要求复现或训练。

学习目标与完整大纲以这份文档为准:

学习方式

每一节课按固定结构推进:

  1. 直觉解释:先知道这个东西解决什么问题。
  2. 核心概念:再明确关键术语和结构。
  3. 最小例子:用表格、矩阵、小代码或模型推理验证。
  4. 理解检查:用几个问题确认是否真正掌握。
  5. 下一步:只推进一个小台阶。

目录

machine-learning/
  00-roadmap/              # 总路线、阶段目标、学习日志
  01-ml-dl-basics/         # 机器学习与深度学习基础
  02-transformer/          # Transformer 与现代大模型
  03-yolo/                 # YOLO 与目标检测
  notebooks/               # 可选轻量代码实验
  papers/                  # 论文与阅读笔记
  projects/                # 阶段小项目

第一轮目标

完成第一轮后,应当能做到:

  • 解释模型、训练、损失函数、梯度下降、过拟合、评估指标。
  • 看懂一个基础神经网络或 CNN 的训练流程。
  • 解释 Transformer 中 token、embedding、Q/K/V、attention、FFN、residual、LayerNorm 的作用。
  • 理解 decoder-only 大语言模型的基本结构、训练后流程和推理流程。
  • 解释 YOLO 的输入输出、bounding box、IoU、NMS/NMS-free、mAP 和预训练模型推理流程。
  • 知道 RAG、LoRA、DPO、量化、MoE、多模态、扩散模型、SAM、RT-DETR 等现代主题位于知识图谱中的哪一层。