李沐论文精读项目:深度学习 30+ 篇经典论文的视频索引
李沐(Mu Li)的 paper-reading 仓库是中文深度学习社区最有影响力的论文精读项目之一。从 2019 年开始,李沐在 B 站和 YouTube 上逐段精读深度学习经典论文,每期视频 1 小时左右,覆盖了从 AlexNet 到 OpenAI Sora 的完整技术演进路线。
这个仓库本质上是一个论文精读视频的索引目录,按时间线和领域分类,附带论文链接、B 站/YouTube 视频链接和引用数动态徽章。
已录制论文(按时间线)
以下是仓库中已录制的论文精读视频,按发布时间排列:
| 日期 | 论文 | 时长 |
|---|---|---|
| 1/10/25 | OpenAI Sora 上(含 Movie Gen 和 HunyuanVideo) | 1:04:18 |
| 1/10/25 | OpenAI Sora 下 | 1:20:38 |
| 12/28/24 | DeepSeek-V3 | 1:06:29 |
| 12/20/24 | Qwen2.5 | 1:01:51 |
| 11/15/24 | Llama 3.1 | 1:23:37 |
| 11/10/24 | Gemma 2 | 1:03:29 |
| 10/18/24 | GPT-4o | 1:07:10 |
| 9/27/24 | RWKV | 1:12:27 |
| 9/6/24 | BytePiece | 1:12:16 |
| 9/1/24 | DPO(Direct Preference Optimization) | 1:04:26 |
| 8/20/24 | RLHF | 1:14:43 |
| 8/3/24 | MoE(Mixture of Experts) | 1:03:26 |
| 7/1/24 | FlashAttention | 1:27:54 |
| 6/15/24 | LLaVA(NeurIPS 2023 最佳论文) | 1:03:40 |
| 5/20/24 | RetNet | 1:02:13 |
| 4/27/24 | LoRA | 1:08:32 |
| 4/15/24 | 量化(Quantization) | 1:37:40 |
可以看到,2024 年的录制节奏明显加快,从 LoRA、量化到 FlashAttention、MoE、RLHF,覆盖了大模型时代最核心的技术栈。
待录制论文(按领域分类)
仓库还维护了一份按领域分类的待录制清单,附有论文链接和 Semantic Scholar 引用数。这份清单本身就是一份优秀的深度学习论文阅读路线图。
基础架构
| 年份 | 论文 | 简介 |
|---|---|---|
| 2012 | AlexNet | 深度学习引爆之作 |
| 2014 | VGGNet | 更深的网络 |
| 2015 | ResNet | 残差连接,解决退化问题 |
| 2017 | Transformer | Attention is All You Need |
| 2020 | ViT(Vision Transformer) | Transformer 进入视觉领域 |
| 2021 | Swin Transformer | 层级式视觉 Transformer |
GAN 系列
| 年份 | 论文 | 简介 |
|---|---|---|
| 2014 | GAN | 生成对抗网络开山之作 |
| 2016 | DCGAN | GAN + CNN |
| 2017 | WGAN | Wasserstein 距离解决训练不稳定 |
| 2017 | CycleGAN | 无配对图像转换 |
| 2018 | StyleGAN | 高质量人脸生成 |
扩散模型
| 年份 | 论文 | 简介 |
|---|---|---|
| 2020 | DDPM | 扩散模型基础 |
| 2021 | Improved DDPM | 改进的 DDPM |
| 2021 | DDIM | 加速扩散采样 |
| 2022 | LDM(Stable Diffusion) | 潜空间扩散模型 |
目标检测
| 年份 | 论文 | 简介 |
|---|---|---|
| 2014 | RCNN | CNN 进入目标检测 |
| 2015 | YOLO | 实时目标检测 |
| 2015 | Faster RCNN | RPN + ROI Pooling |
| 2016 | SSD | 单阶段检测器 |
| 2020 | DETR | Transformer 做检测 |
NLP 与大语言模型
| 年份 | 论文 | 简介 |
|---|---|---|
| 2014 | Seq2Seq | 编码器-解码器框架 |
| 2015 | Attention | 注意力机制 |
| 2018 | BERT | 双向预训练语言模型 |
| 2018 | GPT | 单向预训练语言模型 |
| 2019 | GPT-2 | 更大的语言模型 |
| 2020 | GPT-3 | 少样本学习 |
| 2021 | Codex | 使用注释生成代码 |
| 2022 | InstructGPT | RLHF 对齐 |
| 2023 | Llama | 开源大语言模型 |
优化算法
| 年份 | 论文 | 简介 |
|---|---|---|
| 2014 | Adam | 最常用的优化算法 |
| 2016 | 为什么超大模型泛化性不错 | 深度学习理论 |
| 2017 | 为什么 Momentum 有效 | 可视化解释 |
新领域应用
| 年份 | 论文 | 简介 |
|---|---|---|
| 2016 | AlphaGo | 强化学习出圈 |
| 2020 | AlphaFold | 蛋白质结构预测 |
| 2021 | AlphaFold 2 | 原子级精度蛋白质预测 |
| 2022 | AlphaCode | 媒美一般程序员的编程解题 |
图神经网络
| 年份 | 论文 | 简介 |
|---|---|---|
| 2009 | GNN(GCN) | 图卷积网络 |
| 2017 | GAT | 图注意力网络 |
| 2021 | 图神经网络介绍 | 可视化教程 |
这个仓库的价值
对学习者来说,这是一个精心策划的深度学习论文阅读路线图。不是简单的论文列表,而是一个有教学逻辑的结构化目录——从基础架构到前沿应用,从已录制(有视频可以跟着学)到待录制(可以自己先读)。
对内容创作者来说,李沐的论文精读系列展示了一种高效的知识传播模式:一篇论文 → 1 小时逐段精读视频 → B 站 + YouTube 双平台分发 → GitHub 仓库索引。这种”论文 → 视频 → 索引”的三层结构,让学习路径非常清晰。
对项目维护者来说,这个仓库的引用数动态徽章设计值得学习。每篇论文都接入了 Semantic Scholar 的 API,引用数实时更新,让静态的论文列表变成了”活”的学术追踪面板。
如果你想系统学习深度学习的经典论文,从李沐的这个仓库开始是最省力的路径之一。
评论互动