归藏 PPT Skill 开源解读:把 AI 做 PPT 从灵感生成变成版式工程

发布于 2026年05月25日 00:21 #Skills#AI 生图#Github

归藏 PPT Skill 开源解读:把 AI 做 PPT 从灵感生成变成版式工程 封面图

大家好,我是若风。

最近看了很多设计类 Agent Skill,有一个项目我越看越觉得扎实:op7418/guizang-ppt-skill

它表面上是一个“帮 AI 做 PPT”的 Skill。

但如果你只把它理解成 PPT 模板包,就低估它了。

说实话,我第一次看到“杂志风 PPT”“瑞士风 PPT”这些词时,也有点警觉。因为 AI 生成 PPT 这个领域,已经被太多“好看封面 + 空洞正文 + 一堆大字”搞坏了,用户看第一眼还行,真拿去讲 20 分钟就崩。

Guizang PPT Skill 有意思的地方,是它没有把问题理解成“给模型几个漂亮形容词”。它做的是另一件事:把 PPT 生成拆成风格选择、7 问澄清、模板复制、节奏表、版式骨架、配图比例、质量检查、浏览器预览和迭代修正。

截至 2026 年 5 月 25 日我打开 GitHub 时,这个仓库页面显示大约 11.6k Star、901 Fork,许可证是 MIT。README 里给的安装方式也很直接:

npx skills add https://github.com/op7418/guizang-ppt-skill --skill guizang-ppt-skill

但这篇文章不写“怎么安装”。

我更想聊的是:为什么一个 PPT Skill 能在短时间内拿到这么多关注?它到底把 AI 做 PPT 这件事想明白了哪里?

先说结论

Guizang PPT Skill 的核心价值,不在于“让 AI 做一份更漂亮的 PPT”,而在于把演示文稿生成变成一条可控的版式工程链路。

层次仓库里的对应部分解决的问题
工作流SKILL.md让 Agent 先问清楚,再选择风格、生成节奏、填内容、预览迭代
视觉系统Style A 电子杂志风、Style B 瑞士国际主义避免所有 PPT 都长成同一种 AI 模板
模板层assets/template.htmlassets/template-swiss.html让 Agent 不从零发明页面结构
版式库references/layouts.mdlayouts-swiss.md用固定骨架约束内容和空间关系
图片链路image-prompts.mdscreenshot-framing.md、内置背景让配图比例、截图美化、信息图风格可控
质量门checklist.mdvalidate-swiss-deck.mjs用 P0/P1/P2/P3 和脚本拦住明显问题

所以它不是一个“给 AI 的 PPT prompt”。

更准确地说,它是一套面向 Agent 的 HTML deck 生产系统。

用一句话概括:

归藏 PPT Skill 把 AI 做 PPT 从灵感型生成,推进到了版式、比例、节奏和校验共同约束的工程流程。

这也是它和普通 PPT prompt 最大的区别。普通 prompt 解决“怎么开始”;Guizang PPT Skill 解决“怎么稳定交付”。

为什么是 HTML PPT

README 里专门解释了为什么选择 HTML PPT。

这个选择非常关键。

因为 Agent 最擅长处理的是文本和代码。HTML / CSS 是文本,能被生成、修改、diff、预览、校验;Markdown 太弱,做不了精细排版;传统 PPTX 又太封闭,Agent 直接编辑起来很麻烦。

HTML deck 刚好卡在中间。

它比 Markdown 表现力高,可以做空间定位、横向翻页、主题色、封面、图文排布和动效;又比原生 PPT 更适合 Agent 修改,浏览器打开就能预览,截图和导出也方便。

这就是它的底层判断:

PPT 不一定先是 PPTX,它可以先是一个可运行、可检查、可迭代的 HTML artifact。

这句话对 AI 工作流很重要。

很多 AI PPT 工具会直接生成最终文件,看起来省事,但出了问题很难改。HTML deck 的好处是中间态透明:字号、间距、图片槽位、页码、布局都在代码里。Agent 能读,人也能改。

第一层:先做 7 问,不急着画

Guizang PPT Skill 的使用流程里,第二步就是需求澄清。

README 写得很明确:Agent 会问 7 个问题,包括风格、受众、时长、素材、图片 / 截图需求、主题色、硬约束。

这一步看起来不炫,但特别专业。

AI 做 PPT 最容易翻车的地方,往往不在某页不好看,而在方向错。你想要行业内部闭门分享,它给你做成融资 pitch;你想要克制的分析报告,它做成情绪很满的演讲;你想要 8 页左右,它给你堆 25 页。

这类返工非常揪心。表面上看,只是多改几页;真正难的是演讲逻辑、视觉节奏和素材选择都要跟着重来。

因为越到后面改,成本越高。一个 30 秒的澄清问题,能避免后面 30 分钟的版式重做。

所以我很认同这个流程:先问清楚,再动手。

与其让 AI 一上来就“发挥创意”,不如先把演讲场景、受众、节奏和边界钉住。

第二层:两个风格,不是换皮肤

Guizang PPT Skill 目前最醒目的,是两套风格。

Style A 是电子杂志风,更适合个人分享、观点表达、叙事型演讲。它强调冲击力、情绪、照片、排版张力,适合做那种“拿出来就有作者气质”的演示。

Style B 是瑞士国际主义,更适合方法论、产品分析、行业报告。它强调网格、留白、直角色块、发丝线、图片槽位、标题对齐和比例纪律。

这不是简单换 CSS。

真正的差异在于工作方式。

电子杂志风允许更强叙事感和视觉张力,瑞士风则强调结构约束。README 里对瑞士风写得非常具体:22 个具名版式,正文页只能从 S01S22 中选择;4 套锚点色;16 列 grid;直角色块;1px 发丝线;无阴影、无渐变、无圆角;图片必须进入模板预留的 data-image-slot

这些限制看起来很“烦”。

但它们正是质量来源。

AI 做设计最怕自由度过高。自由度太高,模型就会每页都发明一种新结构,最后整份 PPT 看起来像 10 个不同模板拼起来的。瑞士风的锁定版式,就是在强行降低自由度,让 Agent 在有限空间里做选择。

这和真正的设计系统很像。

好设计的重点不在无限自由,而在有纪律的变化。

第三层:版式库让 Agent 不再乱编页面

仓库目录里有几个关键文件:references/layouts.mdreferences/layouts-swiss.mdreferences/swiss-layout-lock.md

这些文件的作用,是给 Agent 可直接粘贴和改写的页面骨架。

这一步很重要。

如果你只告诉模型“做一页观点页”“做一页流程图”“做一页总结页”,它会靠训练数据临场发挥。发挥好了还行,发挥不好就会出现居中大标题、莫名其妙的装饰图标、左右不齐、图片乱飘、页脚被压住。

版式库的价值,是把“页面怎么长”先固定下来。

Agent 的任务从“发明页面结构”,变成“在结构里填内容、调节比例、选择图片槽位”。

这也是为什么它适合 Agent,而不只是适合人。

人类设计师能凭经验判断空间关系,但 Agent 很容易把空间当成文字容器。固定骨架和图片槽位,等于是给 Agent 画了一条看得见的车道。

别乱开。

第四层:配图是演示链路的一部分

Guizang PPT Skill 对配图的要求也很细。

README 里列了几类常用图片:人文纪实照片、信息图 / 流程图 / 对比图 / 系统关系图、截图美化 / 截图再设计、数据大字报 / 数据图表、多图拼贴。它还强调 4 个规则:图片不能自带页脚、页底、标题、角标、页码或装饰边框;图片语言要跟随 deck 语言;图片比例必须先匹配落位;用户截图需要保真时先读截图适配文档,不要默认重画内容。

这些要求非常实战。

很多 AI PPT 失败,卡点经常不在文字,而在图片把整页毁了。图片自带标题,PPT 又有标题;图片比例不对,被硬裁;截图被模型“美化”后信息变了;信息图语言混杂,中文 deck 里突然出现英文标签。

Guizang PPT Skill 把配图当成 PPT 的嵌入素材,而不是独立作品。

这句话很关键。

生成图的目标不该是炫技,而是服务页面结构和演讲节奏。图片必须服从槽位、比例、语言和信息层级。

这也是它和普通 AI 生图提示词的区别。

普通生图追求单张图好看。

PPT 配图追求放进页面以后成立。

第五层:质量检查比审美词更重要

仓库里有一个 references/checklist.md,README 也提到自检时要对照 P0 / P1 / P2 / P3 分级。瑞士风还要运行:

node scripts/validate-swiss-deck.mjs path/to/index.html

这个校验器会拦住居中标题、实验版式、SVG 内写字、图片脱离槽位等问题。

我特别喜欢这一步。

因为 AI 设计不能只靠“看起来不错”。尤其是 PPT,很多问题第一眼不明显,但演示时会非常刺眼:标题压图、页脚挡正文、图片比例错、页面风格突然跳、字太小、页码不统一、SVG 里写了无法复制的文字。

这些问题如果靠人工肉眼检查,很容易漏。

Skill 把一部分问题写成 checklist 和脚本,就等于给 Agent 加了一道质量门。它不保证每页都惊艳,但能先防止低级错误。

坦白讲,这比再加 20 个“高级感、专业感、科技感”的形容词有用多了。

第六层:它不只做 PPT,还做封面和截图再设计

Guizang PPT Skill 还有一个很实用的扩展:从同一份内容生成不同平台的封面。

README 列了几个规格:公众号头图 21:9,公众号分享卡 1:1,小红书封面 / 轮播 3:4,视频号横版封面 16:9。

这个能力很接地气。

很多内容创作者做完一篇文章或一份 PPT,下一步通常不只是简单“保存文件”,还要发公众号、发小红书、发视频号、发朋友圈。每个平台比例不一样,标题密度不一样,视觉重心也不一样。

如果每次都重新做,很浪费。

Guizang PPT Skill 的思路是:同一份核心观点,可以生成 PPT,也可以生成头图、分享卡和小红书封面,而且视觉保持一致。

这其实让它从“PPT Skill”变成了“演示内容视觉化 Skill”。

PPT 只是其中一个出口。

适合什么场景

第一,长文章变演讲 PPT。 先抽核心观点,再按 6 到 10 页节奏生成 deck,非常适合技术文章、行业分析、产品复盘。

第二,方法论和产品分析。 Style B 瑞士风更适合结构化表达,特别是有框架、有对比、有步骤的内容。

第三,个人观点分享。 Style A 电子杂志风更适合讲故事、有情绪、有观点的演讲。

第四,多平台封面。 公众号 21:9、1:1 分享卡、小红书 3:4、视频号 16:9,都能从同一套内容衍生。

第五,截图统一风格。 如果你的 PPT 里有很多产品截图,内置 screenshot backgrounds 和截图适配规则会很有用。

不适合什么场景

README 也说得很清楚。

第一,大段表格数据。 这种内容需要高信息密度,HTML deck 的视觉化表达不一定合适。

第二,培训课件。 培训课件通常要大量细节、步骤、练习题和可回看内容,Guizang PPT Skill 更偏演讲和观点表达。

第三,多人协作编辑。 静态 HTML 不像 Google Slides 或 PowerPoint 那样适合多人同时改。

第四,完全不想碰浏览器预览和文件系统的人。 这个 Skill 的价值来自 Agent 能读写文件、预览、校验。如果只是普通 Chatbot,稳定性会差很多。

和 Huashu Design、Open Design 的关系

放到最近这几个项目里看,Guizang PPT Skill 的位置很清楚。

Huashu Design 是更宽的设计 Skill,覆盖高保真原型、动画、幻灯片、信息图、设计评审和导出。

Open Design 是本地优先的设计工作台,把 Agent CLI、Skills、Design Systems、daemon 和预览导出串起来。

Guizang PPT Skill 则更聚焦:把演讲文稿这一个垂直场景打磨深。

项目核心关注点更像什么
Huashu Design设计 Agent 工作法设计 Skill 操作系统
Open Design本地设计工作台Agent + daemon + UI 平台
Guizang PPT SkillHTML PPT 和封面生成垂直演示内容生产线

这也是我觉得它很聪明的地方。

它没有试图覆盖所有设计场景,而是把一个高频场景做深:文章变 PPT、PPT 变封面、截图变统一素材、页面变可校验 HTML。

我最喜欢的 3 个判断

第一,用 HTML 作为中间产物。

这让 Agent 能生成、修改、预览、校验,而不是直接掉进 PPTX 黑盒里。

第二,瑞士风锁定版式。

AI 最怕乱发挥,22 个具名版式和 16 列 grid 是很好的约束。

第三,把配图当页面素材。

图片比例、语言、槽位、是否保真,这些规则比“画得好看”更接近真实交付。

我最担心的 3 个问题

第一,HTML deck 和传统办公流程之间仍有缝隙。 如果最终一定要多人在 PowerPoint 里编辑,静态 HTML 不是最自然的格式。

第二,强风格可能变成模板感。 当很多人都用同一套 Style A / Style B,后续需要更多变体和主题,避免审美疲劳。

第三,质量仍依赖 Agent 执行力。 Skill 写得再好,如果 Agent 不认真读 references、不跑校验、不预览,效果还是会掉。

写在最后

Guizang PPT Skill 最值得学的地方,不是“杂志风”或者“瑞士风”这几个词。

真正有价值的是它把 AI 做 PPT 这件事拆成了可执行的工程流程:先问清楚,选风格,套模板,按版式填内容,生成匹配槽位的图片,跑 checklist 和校验器,最后浏览器预览迭代。

这条链路听起来没有“一句话生成精美 PPT”那么刺激。

但它更靠谱。

因为真实交付从来不是靠一句神奇 prompt 完成的。它靠的是约束、结构、比例、复用和检查。

如果说很多 AI PPT 工具还停留在“生成一份看起来像 PPT 的东西”,那 Guizang PPT Skill 已经往前走了一步:

它在教 Agent 像一个懂版式的演示设计师一样工作。

评论互动

© 2026 王若风的技术博客 · Powered by Astro