#Models

共 32 篇文章

围绕 #Models 汇总相关文章,适合连续阅读同一主题下的实践与思考。

  • Anthropic 发布 Claude Fable 5 与 Claude Mythos 5:Mythos 级能力首次走向公众

    Anthropic 正式推出 Claude Fable 5——面向公众的 Mythos 级模型,以及面向可信合作方的 Claude Mythos 5。同一底层模型,两种访问层级。 Anthropic 正式推出 Claude Fable 5——面向公众的 Mythos 级模型,以及面向可信合作方的 Claude Mythos 5。同一底层模型,两种访问层级。

    发布于 2026年06月11日 02:12

  • Claude Fable 5 来了,但真正的大事是 Mythos 开始公开化了

    Anthropic 在 2026 年 6 月 9 日发布 Claude Fable 5。它表面上是一个新模型,实质上更像 Mythos 级能力首次面向公众的“带护栏公开版”。 Anthropic 在 2026 年 6 月 9 日发布 Claude Fable 5。它表面上是一个新模型,实质上更像 Mythos 级能力首次面向公众的“带护栏公开版”。

    发布于 2026年06月10日 23:06

  • 2026 年 15 类具备 AI 隐藏资产的公司

    150+ 家公司横跨 15 个行业,从工业 AI 到支付身份层,挖掘被市场错误标签的 AI 隐藏价值。 150+ 家公司横跨 15 个行业,从工业 AI 到支付身份层,挖掘被市场错误标签的 AI 隐藏价值。

    发布于 2026年06月08日 23:22

  • llama.cpp:一个人、一个周末、一个改变 AI 推理格局的 C++ 文件

    深入拆解 llama.cpp 的设计哲学、量化原理、GGUF 格式和 GGML 张量库,揭示这个纯 C/C++ 推理引擎如何让大模型跑在你的笔记本上 深入拆解 llama.cpp 的设计哲学、量化原理、GGUF 格式和 GGML 张量库,揭示这个纯 C/C++ 推理引擎如何让大模型跑在你的笔记本上

    发布于 2026年06月08日 13:18

  • 写 AI 应用前,先把这 10 个概念讲明白

    Token、Embedding、Attention、RAG、Agent……如果这些概念没想清楚,AI 应用调试起来会非常痛苦。 Token、Embedding、Attention、RAG、Agent……如果这些概念没想清楚,AI 应用调试起来会非常痛苦。

    草稿

    发布于 2026年06月05日 01:49

  • 写代码前必须掌握的 10 个 AI 核心概念

    从 Token 到 Agent,用最通俗的方式建立 AI 工程的完整心智模型,帮你告别调试盲区。 从 Token 到 Agent,用最通俗的方式建立 AI 工程的完整心智模型,帮你告别调试盲区。

    发布于 2026年06月05日 00:36

  • MiniMax M3:前沿编程能力、1M 上下文、原生多模态——三合一模型

    MiniMax 发布 M3 模型,在 SWE-Bench Pro 上超越 GPT-5.5 和 Gemini 3.1 Pro,采用全新 MSA 稀疏注意力架构支持 1M 上下文,原生多模态,是目前唯一同时具备三大前沿能力的开源模型。 MiniMax 发布 M3 模型,在 SWE-Bench Pro 上超越 GPT-5.5 和 Gemini 3.1 Pro,采用全新 MSA 稀疏注意力架构支持 1M 上下文,原生多模态,是目前唯一同时具备三大前沿能力的开源模型。

    发布于 2026年06月01日 21:46

  • DeepSeek 和小米都在降价,为什么公司反而快烧不起 Token 了?

    模型 API 单价正在快速下探,但 AI Coding 和 Agent 场景的总账单却越来越吓人。真正的问题不是 Token 贵不贵,而是我们开始用机器模拟一个 7x24 小时工作的研发团队。 模型 API 单价正在快速下探,但 AI Coding 和 Agent 场景的总账单却越来越吓人。真正的问题不是 Token 贵不贵,而是我们开始用机器模拟一个 7x24 小时工作的研发团队。

    发布于 2026年05月27日 22:34

  • MiMo API 降价背后的技术逻辑:最高降幅 99% 的秘密

    小米 MiMo 团队披露降价原因:分层 KV Cache 优化 + SWA 架构使缓存容量提升 5 倍,1:7 的 Full:SWA 稀疏比让推理成本远低于行业平均水平。 小米 MiMo 团队披露降价原因:分层 KV Cache 优化 + SWA 架构使缓存容量提升 5 倍,1:7 的 Full:SWA 稀疏比让推理成本远低于行业平均水平。

    草稿

    发布于 2026年05月27日 14:35

  • AI Builders Digest 0524:Cerebras CEO 谈 630 亿 IPO、Vercel CEO 的 AI 产品大调查、Box CEO 论 AI 与就业

    Cerebras CEO Andrew Feldman 回忆十年晶圆级芯片创业路和 OpenAI 200 亿美元合作内幕,Vercel CEO Guillermo Rauch 统计 1400 条 AI 产品回复揭示 OpenAI vs Anthropic 格局,Box CEO Aaron Levie 论证为什么 AI 不会消灭岗位。 Cerebras CEO Andrew Feldman 回忆十年晶圆级芯片创业路和 OpenAI 200 亿美元合作内幕,Vercel CEO Guillermo Rauch 统计 1400 条 AI 产品回复揭示 OpenAI vs Anthropic 格局,Box CEO Aaron Levie 论证为什么 AI 不会消灭岗位。

    发布于 2026年05月25日 01:12

  • AI Builders Digest 0523:Oriol Vinyals 谈世界模型、Claude Managed Agents 三大更新、Garry Tan 的 Bar-is-Zero 创业框架

    追踪 AI 建造者动态:Gemini 联合负责人 Oriol Vinyals 深度解读世界模型与持续学习,Anthropic 发布 Managed Agents 的 Dreaming/Outcomes/多 Agent 协作,Garry Tan 提出 bar-is-zero 创业方法论。 追踪 AI 建造者动态:Gemini 联合负责人 Oriol Vinyals 深度解读世界模型与持续学习,Anthropic 发布 Managed Agents 的 Dreaming/Outcomes/多 Agent 协作,Garry Tan 提出 bar-is-zero 创业方法论。

    发布于 2026年05月23日 23:00

  • GLM-5.1-HighSpeed:400 tokens/s 刷新全球大模型 API 速度上限

    智谱旗舰模型 GLM-5.1 高速版本发布,输出速度达 400 tokens/s,200K 上下文窗口,128K 最大输出 智谱旗舰模型 GLM-5.1 高速版本发布,输出速度达 400 tokens/s,200K 上下文窗口,128K 最大输出

    发布于 2026年05月22日 22:17

  • SpaceX 的无界野心:一个 AI 综合体「精译」

    从 Starlink 现金流、Space 发射业务到 xAI 基础设施,看 SpaceX S-1 暴露出的新叙事 从 Starlink 现金流、Space 发射业务到 xAI 基础设施,看 SpaceX S-1 暴露出的新叙事

    发布于 2026年05月22日 16:55

  • AI 公司开始算账了

    Anthropic 接近盈利、OpenAI 卖长期算力、DeepSeek 推进巨额融资,AI 行业正在从烧钱抢地盘,进入认真计算利润和现金流的阶段。 Anthropic 接近盈利、OpenAI 卖长期算力、DeepSeek 推进巨额融资,AI 行业正在从烧钱抢地盘,进入认真计算利润和现金流的阶段。

    发布于 2026年05月22日 13:21

  • 李沐论文精读项目:深度学习 30+ 篇经典论文的视频索引

    整理李沐(Mu Li)的 paper-reading 仓库,涵盖从 AlexNet 到 Sora 的 30+ 篇深度学习经典论文逐段精读视频,按领域分类索引。 整理李沐(Mu Li)的 paper-reading 仓库,涵盖从 AlexNet 到 Sora 的 30+ 篇深度学习经典论文逐段精读视频,按领域分类索引。

    发布于 2026年05月12日 01:50

  • 2026 年前四个月 AI 行业趋势:Agent 崛起、模型竞争与基础设施战争

    基于 AINews 2026 年 1 月到 4 月 issue,梳理 AI 重要产品发布、模型竞争、Agent 工程化、基础设施和安全事件。 基于 AINews 2026 年 1 月到 4 月 issue,梳理 AI 重要产品发布、模型竞争、Agent 工程化、基础设施和安全事件。

    发布于 2026年04月26日 01:35

  • GPT-5.5 来了,这次进步得有点太快了

    OpenAI 发布 GPT-5.5,编码能力大幅跃升,Terminal-Bench 82.7%,NVIDIA 工程师称失去它像截肢,数学家 11 分钟构建代数几何应用。 OpenAI 发布 GPT-5.5,编码能力大幅跃升,Terminal-Bench 82.7%,NVIDIA 工程师称失去它像截肢,数学家 11 分钟构建代数几何应用。

    发布于 2026年04月24日 12:47

  • GPT-5.5 正式发布「官方介绍」

    OpenAI 正式发布 GPT-5.5 与 GPT-5.5 Pro,强化智能体化编程、知识工作、科研与网络安全能力,并公布评测与定价。 OpenAI 正式发布 GPT-5.5 与 GPT-5.5 Pro,强化智能体化编程、知识工作、科研与网络安全能力,并公布评测与定价。

    发布于 2026年04月24日 11:12

  • 马斯克凌晨 3 点发了一张芯片照片,暴露了特斯拉最大的算力焦虑

    特斯拉 AI5 芯片流片成功,2000+ TOPS 算力、192GB 内存对标英伟达 Hopper,但从流片到量产还需 12-18 个月,离真正上车至少等到 2027 年中 特斯拉 AI5 芯片流片成功,2000+ TOPS 算力、192GB 内存对标英伟达 Hopper,但从流片到量产还需 12-18 个月,离真正上车至少等到 2027 年中

    发布于 2026年04月15日 23:58

  • 黄仁勋:NVIDIA 与 AI 革命 | 深度解析 Lex Fridman 访谈

    NVIDIA CEO 黄仁勋与 Lex Fridman 深度对话,揭示极端协同设计、CUDA 战略豪赌、AI 四条缩放定律,以及塑造信念体系的领导哲学 NVIDIA CEO 黄仁勋与 Lex Fridman 深度对话,揭示极端协同设计、CUDA 战略豪赌、AI 四条缩放定律,以及塑造信念体系的领导哲学

    发布于 2026年03月26日 12:00

  • NVIDIA GTC 2026:AI 领域最新动态全记录

    GTC 2026 现场报道,涵盖 Jensen Huang 主题演讲、Vera Rubin 新平台、OpenClaw 支持、Physical AI 等重磅发布 GTC 2026 现场报道,涵盖 Jensen Huang 主题演讲、Vera Rubin 新平台、OpenClaw 支持、Physical AI 等重磅发布

    发布于 2026年03月18日 00:03

  • 一文读懂 NVIDIA GTC 2026:从大模型到 Agent 的七个关键词

    黄仁勋用一场信息量巨大的演讲,勾勒出从大模型走向 AI 助手和 AI 工厂的未来图景。七个关键词带你读懂 GTC 2026。 黄仁勋用一场信息量巨大的演讲,勾勒出从大模型走向 AI 助手和 AI 工厂的未来图景。七个关键词带你读懂 GTC 2026。

    发布于 2026年03月17日 23:30

  • GPT 5.4 vs Claude 4.6:2026 年 AI 战场的新格局

    OpenAI GPT-5.4 发布,100 万上下文、计算机使用能力、工具搜索等新特性,与 Claude Opus 4.6 的全面对比分析 OpenAI GPT-5.4 发布,100 万上下文、计算机使用能力、工具搜索等新特性,与 Claude Opus 4.6 的全面对比分析

    发布于 2026年03月05日 16:01

  • 2026 年 2 月上旬 AI 模型发布潮:国内外六款 SOTA 一览

    一周内 GML 5.0、MiniMax M2.5、DeepSeek V4、月之暗面、字节豆包、OpenAI 等旗舰大模型接连发布或曝光,模型春运速览。 一周内 GML 5.0、MiniMax M2.5、DeepSeek V4、月之暗面、字节豆包、OpenAI 等旗舰大模型接连发布或曝光,模型春运速览。

    发布于 2026年02月14日 21:47

  • AI 日报 2026-06-06

    精选 15 条今日 AI 动态,涵盖 GPT-5 早期体验、Gemma 4 量化模型、Google 太空算力合作、Agentic Era 工具指南、微软开源 pg_durable 等 精选 15 条今日 AI 动态,涵盖 GPT-5 早期体验、Gemma 4 量化模型、Google 太空算力合作、Agentic Era 工具指南、微软开源 pg_durable 等

    发布于 2026年06月06日 23:42

  • AI 日报 2026-05-06

    精选 20 条今日 AI 领域重要动态,涵盖德国 .de 域名 DNSSEC 大面积故障、Gemma 4 推理加速、Computer Use 成本对比分析、GPT-5.5 评测等 精选 20 条今日 AI 领域重要动态,涵盖德国 .de 域名 DNSSEC 大面积故障、Gemma 4 推理加速、Computer Use 成本对比分析、GPT-5.5 评测等

    发布于 2026年05月06日 12:00

  • AI 日报 2026-04-29

    精选 10 条今日 AI 领域重要动态,涵盖 GPT-5 多模态新架构、Llama 3.1 开源模型、Gemini 2.0 Pro、GitHub Copilot Chat Pro 等 精选 10 条今日 AI 领域重要动态,涵盖 GPT-5 多模态新架构、Llama 3.1 开源模型、Gemini 2.0 Pro、GitHub Copilot Chat Pro 等

    发布于 2026年04月29日 12:00

  • AI 日报 2026-04-10

    精选 20 条今日 AI 领域重要动态,涵盖 OpenAI 1220 亿美元融资、GPT-5.4 发布、Gemma 4 开源模型、Anthropic 算力合作、MCP vs Skills 架构等 精选 20 条今日 AI 领域重要动态,涵盖 OpenAI 1220 亿美元融资、GPT-5.4 发布、Gemma 4 开源模型、Anthropic 算力合作、MCP vs Skills 架构等

    发布于 2026年04月10日 12:00

  • AI 日报 2026-04-06

    精选 20 条今日 AI 领域重要动态,涵盖推理模型决策机制、AI 工具致技术退化、德国 eIDAS 数字身份、Codex 切换 API 定价等 精选 20 条今日 AI 领域重要动态,涵盖推理模型决策机制、AI 工具致技术退化、德国 eIDAS 数字身份、Codex 切换 API 定价等

    发布于 2026年04月06日 12:00

  • AI 日报 2026-04-04

    精选 20 条今日 AI 领域重要动态,涵盖 ASI-Evolve 自我进化框架、SKILL0 智能体强化学习、Mollick 论 Agent 时代、Paul Graham 论写作等 精选 20 条今日 AI 领域重要动态,涵盖 ASI-Evolve 自我进化框架、SKILL0 智能体强化学习、Mollick 论 Agent 时代、Paul Graham 论写作等

    发布于 2026年04月04日 12:00

  • AI 日报 2026-03-25

    精选 20 条今日 AI 领域重要动态,涵盖 LiteLLM 供应链攻击、Apple Business 平台、Wine 11 内核级重写等 精选 20 条今日 AI 领域重要动态,涵盖 LiteLLM 供应链攻击、Apple Business 平台、Wine 11 内核级重写等

    发布于 2026年03月25日 12:00

  • AI 日报 2026-03-24

    精选 20 条今日 AI 领域重要动态,涵盖 LiteLLM 供应链攻击、Omni-WorldBench 世界模型评估、ARM AGI CPU 等 精选 20 条今日 AI 领域重要动态,涵盖 LiteLLM 供应链攻击、Omni-WorldBench 世界模型评估、ARM AGI CPU 等

    发布于 2026年03月24日 12:00

© 2026 王若风的技术博客 · Powered by Astro