李沐论文精读项目:深度学习 30+ 篇经典论文的视频索引

发布于 2026年05月12日 01:50 #Models#论文

李沐论文精读项目:深度学习 30+ 篇经典论文的视频索引 封面图

项目地址:https://github.com/mli/paper-reading

李沐(Mu Li)的 paper-reading 仓库是中文深度学习社区最有影响力的论文精读项目之一。从 2019 年开始,李沐在 B 站和 YouTube 上逐段精读深度学习经典论文,每期视频 1 小时左右,覆盖了从 AlexNet 到 OpenAI Sora 的完整技术演进路线。

这个仓库本质上是一个论文精读视频的索引目录,按时间线和领域分类,附带论文链接、B 站/YouTube 视频链接和引用数动态徽章。

已录制论文(按时间线)

以下是仓库中已录制的论文精读视频,按发布时间排列:

日期论文时长
1/10/25OpenAI Sora 上(含 Movie Gen 和 HunyuanVideo)1:04:18
1/10/25OpenAI Sora1:20:38
12/28/24DeepSeek-V31:06:29
12/20/24Qwen2.51:01:51
11/15/24Llama 3.11:23:37
11/10/24Gemma 21:03:29
10/18/24GPT-4o1:07:10
9/27/24RWKV1:12:27
9/6/24BytePiece1:12:16
9/1/24DPO(Direct Preference Optimization)1:04:26
8/20/24RLHF1:14:43
8/3/24MoE(Mixture of Experts)1:03:26
7/1/24FlashAttention1:27:54
6/15/24LLaVA(NeurIPS 2023 最佳论文)1:03:40
5/20/24RetNet1:02:13
4/27/24LoRA1:08:32
4/15/24量化(Quantization)1:37:40

可以看到,2024 年的录制节奏明显加快,从 LoRA、量化到 FlashAttention、MoE、RLHF,覆盖了大模型时代最核心的技术栈。

待录制论文(按领域分类)

仓库还维护了一份按领域分类的待录制清单,附有论文链接和 Semantic Scholar 引用数。这份清单本身就是一份优秀的深度学习论文阅读路线图。

基础架构

年份论文简介
2012AlexNet深度学习引爆之作
2014VGGNet更深的网络
2015ResNet残差连接,解决退化问题
2017TransformerAttention is All You Need
2020ViT(Vision Transformer)Transformer 进入视觉领域
2021Swin Transformer层级式视觉 Transformer

GAN 系列

年份论文简介
2014GAN生成对抗网络开山之作
2016DCGANGAN + CNN
2017WGANWasserstein 距离解决训练不稳定
2017CycleGAN无配对图像转换
2018StyleGAN高质量人脸生成

扩散模型

年份论文简介
2020DDPM扩散模型基础
2021Improved DDPM改进的 DDPM
2021DDIM加速扩散采样
2022LDM(Stable Diffusion)潜空间扩散模型

目标检测

年份论文简介
2014RCNNCNN 进入目标检测
2015YOLO实时目标检测
2015Faster RCNNRPN + ROI Pooling
2016SSD单阶段检测器
2020DETRTransformer 做检测

NLP 与大语言模型

年份论文简介
2014Seq2Seq编码器-解码器框架
2015Attention注意力机制
2018BERT双向预训练语言模型
2018GPT单向预训练语言模型
2019GPT-2更大的语言模型
2020GPT-3少样本学习
2021Codex使用注释生成代码
2022InstructGPTRLHF 对齐
2023Llama开源大语言模型

优化算法

年份论文简介
2014Adam最常用的优化算法
2016为什么超大模型泛化性不错深度学习理论
2017为什么 Momentum 有效可视化解释

新领域应用

年份论文简介
2016AlphaGo强化学习出圈
2020AlphaFold蛋白质结构预测
2021AlphaFold 2原子级精度蛋白质预测
2022AlphaCode媒美一般程序员的编程解题

图神经网络

年份论文简介
2009GNN(GCN)图卷积网络
2017GAT图注意力网络
2021图神经网络介绍可视化教程

这个仓库的价值

对学习者来说,这是一个精心策划的深度学习论文阅读路线图。不是简单的论文列表,而是一个有教学逻辑的结构化目录——从基础架构到前沿应用,从已录制(有视频可以跟着学)到待录制(可以自己先读)。

对内容创作者来说,李沐的论文精读系列展示了一种高效的知识传播模式:一篇论文 → 1 小时逐段精读视频 → B 站 + YouTube 双平台分发 → GitHub 仓库索引。这种”论文 → 视频 → 索引”的三层结构,让学习路径非常清晰。

对项目维护者来说,这个仓库的引用数动态徽章设计值得学习。每篇论文都接入了 Semantic Scholar 的 API,引用数实时更新,让静态的论文列表变成了”活”的学术追踪面板。

如果你想系统学习深度学习的经典论文,从李沐的这个仓库开始是最省力的路径之一。

评论互动

© 2026 王若风的技术博客 · Powered by Astro