AI 时代的信息焦虑解药:50+ 资讯源、工具和开源项目全梳理
大家好,我是若风。
最近有件事让我挺焦虑的,就是从 AI 资讯的信息源头如何跟上 AI 的发展步伐。
每天早上打开手机,arXiv 上新增几百篇论文,Hugging Face 又上线了几个新模型,某个大厂悄悄发了个技术报告,朋友圈里有人在讨论一篇我完全没看过的论文。。。就那种感觉,你站在消防水龙头面前想喝一口水,根本张不开嘴。
我寻思了一下,不行,得想办法。然后花了大概 3 天时间,把 AI 资讯获取这事儿从头到尾捋了一遍,从中文媒体到英文 Newsletter,从论文追踪工具到 GitHub 开源项目,整理了 50 多个值得关注的资源。加上两个特别有意思的 AI 资讯聚合站,这篇文章就是一份完整的指南。
说到这个,在推荐具体资源之前,我想先聊一下我获取 AI 资讯的方法。工具会变,但方法不会,这个比资源本身更重要。
我的信息获取分三层。
第一层是广度扫描,每天花 5-10 分钟快速扫一遍当天的 AI 新闻摘要,知道发生了什么就行。这一层追求的是速度和覆盖面,不需要深入,只要不漏掉重要事件。
第二层是深度阅读,每周挑 2-3 篇真正值得深挖的内容精读,搞清楚为什么重要。这一层追求的是理解和思考,看完能形成自己的判断。
第三层是趋势判断,每月或每季度看一次宏观报告和数据分析,感知方向往哪走。这一层追求的是视角,帮你在噪音中找到信号。
下面所有的资源推荐,我都会标注它适合哪一层使用。
先说中文资源,这是大多数人最直接的信息入口。
机器之心 是国内最老牌也最扎实的 AI 媒体。论文解读质量很高,覆盖面也广,从学术前沿到产业落地都有。如果你只关注一个中文 AI 媒体,选它就够了。
量子位 的风格更接地气,擅长把复杂的 AI 技术用通俗的方式讲明白。它的微信公众号影响力很大,很多人是通过朋友圈看到量子位的文章才开始关注某个话题的。
新智元 更偏产业和政策视角,经常举办 AI 峰会和奖项评选。如果你关注 AI 的商业化和政策走向,这个值得关注。
36 氪的 AI 频道 是看 AI 创投融资和产业动态的最佳选择。哪家 AI 公司拿了多少钱、估值多少、业务方向是什么,36 氪通常第一时间报道。
还有一些垂直度更高的资源。PaperWeekly 是一个学术论文讨论社区,特别适合做研究的人。InfoQ 的 AI 板块 偏工程实践,适合开发者。AI 科技评论 和雷峰网 则各有侧重,前者偏学术,后者偏应用。
回到资源推荐这块,在传统媒体之外,最近出现了两个很有意思的 AI 资讯聚合站。它们的共同点是,用 AI 来筛选 AI 领域的新闻,属于用魔法打败魔法。
AI HOT 是卡兹克做的 AI 资讯聚合站。它最大的特色是每条资讯都附带一段「推荐理由」,由 AI 自动生成,告诉你为什么这条内容值得关注。内容按模型、产品、行业、论文、技巧五个维度分类,还有每日 AI 日报。对不想花时间自己判断信息价值的人来说,这个站已经帮你做了一次高质量的预筛选。
NewsNow 是一个开源的新闻聚合阅读器,GitHub 上有 2 万 Star 。它聚合了知乎、微博、酷安、36 氪、华尔街见闻等多个平台的热点新闻,实时更新,界面简洁优雅。虽然不是 AI 专用,但它的「实时」和「最热」两个频道特别适合快速扫一眼当天科技圈在关注什么。因为是开源项目,你完全可以自己部署一套,定制数据源。
坦率的讲,很多 AI 领域的重大消息,英文媒体的报道速度和深度都领先中文媒体 1-2 天。如果你能直接读英文,下面这些是必看的。
The Verge 的 AI 板块 在消费级 AI、政策和文化的报道上做得非常好,文章可读性强,不会特别技术化。
TechCrunch AI 是看 AI 创投和产品发布的第一选择。哪家公司融资了、发布了什么新产品,这里消息最快。
MIT Technology Review 的 AI 报道是我个人最喜欢的,深度和广度兼备。它不只是告诉你发生了什么,还会深入分析背后的逻辑和影响,对 AI 伦理和社会影响的讨论尤其到位。不过部分内容需要付费订阅。
VentureBeat AI 在企业 AI 和生成式 AI 的报道上很扎实,每年还会举办 Transform 大会。
The Gradient 是一个偏研究导向的平台,上面会有一些高质量的 AI 评论和长文,适合想深入理解某个方向的人。
IEEE Spectrum 的 AI 报道从工程和研究的视角出发,对硬件、芯片、系统层面的 AI 新闻覆盖得比较多。
说到研究这块,如果你想知道一个技术突破的原始信息,最好的方式不是看新闻报道,而是直接去看研究机构的官方博客。
OpenAI Blog 是 GPT 系列和 DALL-E 相关消息的第一手来源。Google AI Blog 和 DeepMind Blog 分别覆盖 Google 和 DeepMind 的研究进展,AlphaGo、AlphaFold、Gemini 的重要进展都是先在这些博客发布的。
Anthropic 的新闻页 会发布 Claude 相关的技术报告和研究成果,对 AI 安全方向的关注比较多。Meta AI Blog 发布 LLaMA 系列模型和 FAIR 的研究。Hugging Face Blog 则是开源 AI 生态的中心,新模型发布、Transformers 教程、社区动态都在这里。
这些博客的信息密度比新闻报道高得多,而且没有二手转述的误差。缺点是阅读门槛也更高,但如果你是做技术的,这反而是最对味的信息源。
arXiv 每天新增几百篇 AI 相关论文,直接去刷是不现实的。以下这些工具可以帮你高效筛选。
Semantic Scholar 是我用得最多的学术搜索工具。它由 Allen Institute for AI 开发,最实用的功能是 TLDR,每篇论文都有一个一句话摘要,让你 5 秒钟判断这篇论文值不值得读。它还支持邮件订阅,你可以设置关键词(比如 large language models) ,有新论文就会通知你。
Connected Papers 的玩法很有意思。你给它一篇论文,它会生成一张关系图谱,显示这篇论文的前作和后作,帮你快速了解一个研究领域的前世今生。做文献综述的时候特别好使。
Papers With Code 把论文、代码实现和基准测试结果绑在了一起。看完一篇论文,直接点进去就能找到代码,还能看到这个方法在不同任务上的排名。它维护的 SOTA 排行榜是了解各个任务当前最优解的最好方式。
Hugging Face Daily Papers 每天精选社区讨论最多的 arXiv 论文。比起你自己去 arXiv 挑,这里已经被社区帮你过滤了一遍,能看到大家都在关注什么。
arXiv Sanity 是 Andrej Karpathy 做的论文推荐工具,基于你的阅读历史推荐相关论文。虽然界面有点简陋,但推荐质量很高。
Research Rabbit 和 Connected Papers 类似,但交互方式更灵活,可以不断迭代扩展你的论文库。它还能和 Zotero 集成,适合有文献管理需求的 researchers。
如果你只想花最少的时间获取最多的信息,订阅几个优质的 AI Newsletter 是性价比最高的选择。
TLDR AI 是我每天早上必读的。它把当天最重要的 AI 新闻、论文和工具浓缩成一封邮件,5 分钟就能读完,信息密度极高。如果你只订阅一个,选这个。
The Rundown AI 的风格更轻松一些,内容覆盖也很全面。Ben’s Bites 更侧重 AI 工具和产品发布的资讯。
Import AI 由 Jack Clark 主笔,他是 Stanford AI Index 的联合主席。这个 Newsletter 的特点是分析深度很高,不是简单罗列新闻,而是给出有洞察的解读。
The Batch 是吴恩达团队出品的周报,用教育的视角来解读 AI 发展,适合想理解为什么的读者。
Ahead of AI 是 Sebastian Raschka 的 Newsletter,偏研究导向,对 ML 论文的解读非常到位。Latent Space 则偏 AI 工程和基础设施,适合在一线做 AI 开发的工程师。
还有一个不得不提的,AK’s Daily Papers。这不是传统 Newsletter,而是 Twitter 上 @_akhaliq 这个账号每天发布的 arXiv 论文精选。在 AI 研究圈子里,这可能是跟进最新论文最及时的方式。
社区的力量在于集体筛选。当几千个从业者同时关注某个话题时,信号自然会浮出水面。
Hacker News 是程序员圈子里最受欢迎的链接聚合平台。AI 相关的话题经常登上首页,评论区的讨论质量也很高,经常能看到业内人士的分析。
Reddit r/MachineLearning 有超过 300 万成员,是最大的 ML 社区。它的标签系统做得很好,[R] 代表论文、[D] 代表讨论、[P] 代表项目、[N] 代表新闻,你可以按标签筛选自己感兴趣的内容。
Reddit r/LocalLLaMA 专注于本地部署和开源大模型。如果你想自己跑模型、搭建私有化方案,这个社区是宝藏。
Hugging Face Hub 不只是一个模型仓库,它也有一套社区讨论系统。新模型发布后,下面经常有很有价值的讨论。
最后说说 GitHub 上的资源。
arxiv-sanity-preserver 是 Karpathy 做的论文推荐系统,可以说是这个品类的鼻祖,5000 多 Star。arxiv-daily 可以自动生成每日 arXiv 论文摘要并发布到 GitHub Pages,1000 多 Star。
如果你只关注 LLM 方向的论文,arxiv-daily-llm 专门筛选 LLM 相关的论文,每天更新。
GitHub 上的 Awesome 系列是发现资源的好入口。awesome-machine-learning 有 6.5 万 Star,按编程语言分类整理了 ML 框架和库。Deep-Learning-Papers-Reading-Roadmap 有 4 万 Star,把最重要的深度学习论文按学习路径组织起来,非常适合想系统学习的人。
Awesome-LLM 整理了 LLM 相关的论文、模型、数据集和训练框架,2 万 Star。ML-For-Beginners 是微软出的 12 周 ML 入门课程,7 万 Star,质量和结构都是顶级的。
模型评估这块,open-llm-leaderboard 是开源 LLM 的标准排行榜,基于 ARC、HellaSwag、MMLU 等基准测试进行评估。
FastChat / Chatbot Arena 有 3.8 万 Star,它背后的 Chatbot Arena 通过匿名人工对比来排名大模型,是目前最受认可的人类评估榜单。
lm-evaluation-harness 是 EleutherAI 做的 LLM 评估框架,Hugging Face 的排行榜就是基于它跑出来的。
研究基础设施方面,transformers 有 14 万 Star,是开源 AI 生态的核心库。MLflow 和 wandb 分别是实验管理和追踪的主流工具。DVC 做数据版本控制,Optuna 做超参优化,这几个工具组合起来就是一套完整的 ML 研发基础设施。
除了日常新闻,定期看看宏观趋势也很有必要。
Stanford AI Index Report 是每年必读的报告。它从研究、技术性能、经济、教育、政策等多个维度全面评估 AI 的发展状况,是最权威的年度 AI 状态总结。
Google Trends 可以对比不同 AI 话题的搜索热度变化,比如你可以看 GPT-4、Claude、Gemini 三个词的搜索量走势,直观感受用户关注度的变化。
Exploding Topics 专注于发现还没出圈但正在快速增长的趋势。如果你想在某个 AI 方向成为早期关注者,这个工具很有帮助。
CB Insights 追踪 AI 创投融资和并购活动。投资流向往往能反映行业的真实走向,钱去哪,哪里就是下一个热点。
最后分享一下我现在的日常信息获取流程,供参考。
每天早上花 5 分钟看 TLDR AI,快速了解昨天的 AI 大事。然后花 3 分钟刷一下 Hugging Face Daily Papers,看看有什么值得注意的新论文。
每周挑 2-3 篇感兴趣的论文或文章精读。用 Semantic Scholar 追踪特定方向的进展,用 Connected Papers 扩展阅读面。
每个月看一次 Hacker News 和 Reddit r/MachineLearning 上被大量讨论的话题,感受一下社区的关注点在怎么变化。
每季度读一遍 Stanford AI Index 的更新,或者过一遍 CB Insights 的 AI 投资报告,校准自己对大方向的判断。
说实话,这个流程花的时间并不多,大概每天 15 分钟、每周 1-2 小时、每月 2-3 小时。但它让我在面对 AI 领域的信息洪流时,有一种「我知道我在看什么」的掌控感。
AI 领域的信息焦虑,说到底不是信息太少,而是信息太多、信噪比太低。
解决方案不是看更多的东西,而是建立一套自己的信息获取体系,有广度扫描的层次,有深度阅读的层次,有趋势判断的层次。然后在每个层次上,选对工具。
这篇文章里提到的 50 多个资源,你不需要全都用。说真的,根据你的角色和兴趣方向,挑几个最适合自己的,坚持下去就够了。
信息获取是一场持久战,不是冲刺。找到自己的节奏,比追上所有热点更重要。
谢谢你看我的文章,我们,下次再见。
评论互动