扒完微信 AI 的官方文档和那份 demo:小微会聊天不稀奇,能调起你的小程序才稀奇
微信「小微」刷屏,但大多数人只看到它会聊天。我们把官方 9 篇开发文档和那个 WeStoreCafe 点单 demo 逐个文件扒了一遍——真正的口子是小程序「AI 开发模式」:让小微调起你的小程序去干活。这篇讲清这盘棋怎么下、demo 藏了什么料、开发者和商家现在该做什么、别碰什么。
这几天朋友圈被微信的「小微」刷屏了。有人让它推荐早晨听的歌,它甩回来一个点开就能播的歌单;有人说「5 分钟后提醒我喝水」,它真在微信里建了条待办;还有人让它点奶茶,它开始帮你操作微信里的小程序。
热闹是热闹,但大部分人围观的是「小微会聊天」这件事。
我们花了一整天,把微信官方放出来的 9 篇开发文档、那个 WeStoreCafe 点单的官方 demo,加上几篇报道和社区一手反馈,从头到尾扒了一遍。结论就一句话:
小微会聊天不稀奇,稀奇的是它能调起你的小程序去干活——而这个口子,微信已经对开发者和商家打开了。
这篇不灌鸡汤、不复述新闻,只把三件事讲清楚:这盘棋长什么样、官方那份 demo 到底藏了什么料、以及如果你是开发者或商家,现在该做什么、别做什么。
一、先看懂这盘棋
很多人把小微理解成「微信版 ChatGPT」,这个框架一上来就错了。
小微的定位不是「又一个聊天框」,而是入口。截至今年一季度末,微信合并月活 14.32 亿,平台上有数百万个小程序。当这些小程序都能被小微顺畅调用时,用户不用再在一个个 App、一个个小程序之间跳来跳去——一句话,从「我想喝咖啡」到「付款成功」全程在对话里走完。
这件事拆开看是三层,缺一层都跑不通:
| 层 | 是什么 | 谁在用 |
|---|---|---|
| C 端:小微 | 用户面对的 AI 助手,能操作微信原生功能、调起小程序、搜索 / 生成内容 | 14 亿用户(内测灰度中) |
| 开发层:AI 开发模式 | 让小程序把自己的能力「暴露」给小微调用的框架 | 开发者 / 商家 ← 本文重点 |
| 交易层:微信支付 AI 专属卡 | 让用户在对话里直接完成「推荐 → 下单 → 支付」 | 商家 / 平台 |
下面要扒的,就是中间那层开发模式——因为这才是决定「谁家的小程序在小微里更好用」的地方。
二、把官方那份 demo 扒开(这部分是重点,建议收藏)
光看文档容易晕,好在微信开源了一个完整 demo:wechat-miniprogram/ai-mode-demo,一个叫 WeStoreCafe 的点单场景。我们把它的代码逐个文件读了一遍,用它来讲最直观。
2.1 四个概念,先认清
整个开发模式,翻来覆去就是这四个东西:
| 概念 | 一句话 | 类比 |
|---|---|---|
| SKILL | 一个完整场景的能力包(一个小程序最多 30 个) | 一个「技能」 |
| 原子接口(API) | 最小执行单元,干一件具体的事,跑在独立 JS 环境 | 一个「工具函数」 |
| 原子组件 | 把接口返回的数据渲染成对话里的卡片 | AI 对话里的「卡片」 |
| 半屏页面 | 卡片装不下时弹出的半屏小窗(选规格、填地址) | 「弹窗补充信息」 |
它们之间靠一套叫小程序 MCP 的协议串起来。你不用懂协议细节,只要把「技能」按规矩写好,小微后台的大模型就能自己推理:该调哪个接口、填什么参数、什么时候出卡片。
WeStoreCafe 这个点单技能,拆出来是 10 个原子接口 + 6 个卡片组件,覆盖「推荐 → 搜索 → 选规格 → 填地址 → 下单 → 支付 → 查门店」全流程。
2.2 一次「点杯拿铁」,背后发生了什么
用户说「点一杯 WeStore 拿铁,少糖」,这句话在系统里是这么跑的:
用户:「点一杯 WeStore 拿铁,少糖」
↓ 上行
小微后台:加载 SKILL → 大模型推理:该调 searchDrinks
↓ 下发接口调用
客户端:执行原子接口 → 请求商家服务器拿到饮品数据
↓ 回传
小微后台:推理 → 下发「渲染卡片」指令
↓
客户端:渲染饮品卡片 → 用户点选 → 确认规格 → 拉起微信支付
↓
完成,全程没离开对话框
注意这里的分工:大模型负责「想」(推理调哪个接口),你的代码负责「做」(执行业务、返回数据),微信客户端负责「渲染」(出卡片)。 你要写的,就是中间那层「做」和「渲染」。
2.3 真正的狠料:怎么「管住」这个大模型
到这儿才是开发者最该看的部分。大模型是个概率机器,你不管它,它就会瞎填参数、跳步骤、编数据。微信官方在《最佳实践》里把「怎么驯服它」讲得非常细,挑三个最有冲击力的:
狠料一:信息源是有「注意力权重」的,写错地方等于白写。
模型在做决策时,会同时读好几处文字,但它们的权重天差地别:
| 信息源 | 注意力 | 该写什么 |
|---|---|---|
接口返回的 content | ★★★★★ | 本次结果 + 下一步动作 |
接口声明的 description | ★★★★ | 这个接口干嘛、什么时候调 |
参数的 inputSchema.description | ★★★★ | 这个参数怎么填、缺省怎么办 |
SKILL.md | ★★★ | 跨接口的业务流程和铁律 |
很多人习惯把所有说明一股脑写进一个大文档,结果模型根本「注意」不到。正确做法是哪个权重高写哪儿。
狠料二:「事实 + 动作」两段式。
接口返回给模型的话,不能只说「接下来展示订单卡片」,得先陈述事实、再给动作。看官方 demo 里 searchDrinks 真实返回的文案:
已搜索到 3 款匹配「拿铁」的饮品。接下来为用户展示搜索结果卡片,
用简短话术引导用户从卡片中选择,禁止以纯文本列出饮品详情。
先「已搜到 3 款」(事实),再「展示卡片 + 别用纯文本列」(动作 + 禁令)。少了前半句,模型可能把「展示卡片」误读成「准备调下一步」,直接跳过等用户确认。
狠料三:堵死错误退路,每条禁令配一个出口。
最骚的是失败分支的写法。还是 demo 里的真实代码,没搜到饮品时它这么回:
未在商品库中匹配到包含「圣诞限定款」的饮品记录。
禁止编造商品名再次调用本接口,禁止使用空关键词兜底搜索。
正确出口:引导用户换个关键词,或调用 getRecommendedDrinks 展示推荐。
陈述事实 + 指出禁止动作 + 给出正确出口,三件套齐活。还有参数说明里这种「防编造」的写法:
drinkId:必须来自上游接口返回的 items[].drinkId 原值。
禁止从用户自然语言(如「那个 3 号」)推断,禁止使用示例值。
读到这儿你应该回过味来了:在这套体系里,最值钱的能力不是会写代码,是会给 AI 写「说明书」。 一半是工程,一半是提示词功夫。
2.4 卡片的「紧箍咒」:原子组件限制清单
想做卡片的注意,原子组件不是普通小程序页面,限制很硬:
- 能用的组件就那几个:
image只接网络 URL、只支持 png / jpg;button不支持任何open-type;scroll-view只能横向滚动。 - 卡片高度初始化时定死,后续不可改;最小高宽比 4:1,禁止上下滚动。
- 默认不让发网络请求、不让用定时器,要用得单独声明「实时动态组件」、过审才行。
- 不支持动画,不支持打开别的小程序。
换句话说,卡片是个「轻量展示位」,复杂交互得靠点击后弹半屏页面去做。设计的时候就得迁就这些规矩,别照搬小程序页面思路。
三、红线在哪:这部分能帮你少踩坑
微信做这套东西,克制得有点反直觉。把红线讲清楚,比讲功能更重要——这也是判断一个团队「懂不懂行」的分水岭。
小微整体是「只读多、动手少」。拿到内测的人反复提到:发消息要确认、打电话要确认、涉及钱的动作处处设卡。半屏页面里,跳公众号、跳视频号、跳别的小程序、跳地图 App、做广告,统统被禁掉。
有个做 AI 的同行说得很到位:「微信 Agent 容易翻车的点,不是回答聪不聪明,而是它进了熟人关系链以后,权限默认给到哪一层。」
一句话点透:微信给 AI 划的,不是能力的上限,是信任的下限。 14 亿用户的信任负担,比任何一个炫酷功能都重。理解了这条,你就理解了它为什么处处要确认、处处设限——也就知道自己接入时,哪些事压根别想碰。
四、那么,现在该做什么?
讲完料,落到行动。分两类人说。
如果你是开发者
第一步,申请内测。 路径:微信公众平台 → 基础功能 → AI 能力,接入模式选「开发模式」申请;或在小程序「微信开发者助手」里的「微信 AI 管理」申请。
第二步,别硬写,用 AI 帮你接 AI。 这是最被低估的一点——微信官方把接入做成了一套给 Coding Agent 用的三件套,配合 CodeBuddy、Claude Code 这类工具:
| 工具 | 干嘛的 |
|---|---|
wxa-skills-generate | 读你现有的小程序代码,自动生成原子接口和组件 |
wxa-skills-validate | 拿开发者工具真实跑一遍,按结果闭环修正 |
wxa-skills-eval | 模拟用户对话评测,出通过率 / 覆盖率 / 优化建议报告 |
也就是说,你对着 Claude Code 说一句「帮我分析这个项目,接入微信小程序 AI 开发模式」,它就能进生成流程。门槛比你想的低,但调优功夫(那套提示词工程)省不掉。 官方建议每个技能至少跑 30 条评测用例。
第三步,先拿一个最小场景跑通。 别一上来封装 30 个技能,挑一个高频、闭环短的场景(查询、点单、预约)先做出来、跑通评测,再扩。
如果你是商家 / 老板
先问自己一个问题:我的小程序,是想「能被调用就行」,还是想「在对话里特别好用」?
我们的判断是:现在卡位的意义,大于现在做得多完美。 等公测放量,用户习惯一旦养成,「在小微里好不好用」会直接变成流量分配。早接入的人,吃的是被小微优先调起的心智。
(到底值不值得接、什么生意适合接,我们单独写了一篇算账的:外贸商家该不该用微信 AI 小程序做对话询盘。)
五、我们的几个判断
- 这波最让人兴奋的,是「一句话生成小工具」。 当生成 + 分发 + 调用都长在 14 亿人的微信里,独立 AI 应用平台的处境会很微妙。但反过来,对小程序和商家是利好——你不再需要自己抢用户,你只需要让自己「能被那个超级入口调起」。
- 巨头做 AI,慢未必是坏事。 14 亿人的信任,经不起一次 Agent 乱删消息、乱发朋友圈。微信赌的不是「最聪明的 Agent」,是「最让人放心的 Agent」——它的「慢和克制」本身就是护城河。
- 对个人开发者,这是个少见的时间窗。 功能内测、文档刚出、绝大多数人没看懂。会写业务编排 + 会给模型写「说明书」的人,现在动手,等于在公测前把位置占了。别人在围观小微聊天,你应该去读那份 skill 文档。
红利从来不属于围观的人,属于看懂规则、动手早的人。
想直接抄近路?
这次扒文档的全过程,我们整理成了一份《微信 AI 接入实战手册》:官方 9 篇文档精编 + WeStoreCafe demo 逐层拆解(10 个原子接口 + 6 张卡片、真实的 mcp.json / SKILL.md 范本)+ 接入自查清单,14 页、免费下载。
需要接入落地——可行性评估、SKILL 封装、原子接口 / 组件实现、评测调优到上线——也可以直接 聊聊你的项目,模酷工程团队替你跑通。
资料来源:微信官方《小程序 AI 开发模式(beta)接入指南 / 运行机制 / 最佳实践 / 评测调试》系列文档;官方开源 demo wechat-miniprogram/ai-mode-demo(WeStoreCafe 点单场景);腾讯 2026 Q1 业绩报告(微信合并月活 14.32 亿)。
延伸阅读