扒完微信 AI 的官方文档和那份 demo：小微会聊天不稀奇，能调起你的小程序才稀奇

这几天朋友圈被微信的「小微」刷屏了。有人让它推荐早晨听的歌，它甩回来一个点开就能播的歌单；有人说「5 分钟后提醒我喝水」，它真在微信里建了条待办；还有人让它点奶茶，它开始帮你操作微信里的小程序。

热闹是热闹，但大部分人围观的是「小微会聊天」这件事。

我们花了一整天，把微信官方放出来的 9 篇开发文档、那个 WeStoreCafe 点单的官方 demo，加上几篇报道和社区一手反馈，从头到尾扒了一遍。结论就一句话：

小微会聊天不稀奇，稀奇的是它能调起你的小程序去干活——而这个口子，微信已经对开发者和商家打开了。

这篇不灌鸡汤、不复述新闻，只把三件事讲清楚：这盘棋长什么样、官方那份 demo 到底藏了什么料、以及如果你是开发者或商家，现在该做什么、别做什么。

一、先看懂这盘棋

很多人把小微理解成「微信版 ChatGPT」，这个框架一上来就错了。

小微的定位不是「又一个聊天框」，而是入口。截至今年一季度末，微信合并月活 14.32 亿，平台上有数百万个小程序。当这些小程序都能被小微顺畅调用时，用户不用再在一个个 App、一个个小程序之间跳来跳去——一句话，从「我想喝咖啡」到「付款成功」全程在对话里走完。

这件事拆开看是三层，缺一层都跑不通：

层	是什么	谁在用
C 端：小微	用户面对的 AI 助手，能操作微信原生功能、调起小程序、搜索 / 生成内容	14 亿用户（内测灰度中）
开发层：AI 开发模式	让小程序把自己的能力「暴露」给小微调用的框架	开发者 / 商家 ← 本文重点
交易层：微信支付 AI 专属卡	让用户在对话里直接完成「推荐 → 下单 → 支付」	商家 / 平台

下面要扒的，就是中间那层开发模式——因为这才是决定「谁家的小程序在小微里更好用」的地方。

二、把官方那份 demo 扒开（这部分是重点，建议收藏）

光看文档容易晕，好在微信开源了一个完整 demo：wechat-miniprogram/ai-mode-demo，一个叫 WeStoreCafe 的点单场景。我们把它的代码逐个文件读了一遍，用它来讲最直观。

2.1 四个概念，先认清

整个开发模式，翻来覆去就是这四个东西：

概念	一句话	类比
SKILL	一个完整场景的能力包（一个小程序最多 30 个）	一个「技能」
原子接口（API）	最小执行单元，干一件具体的事，跑在独立 JS 环境	一个「工具函数」
原子组件	把接口返回的数据渲染成对话里的卡片	AI 对话里的「卡片」
半屏页面	卡片装不下时弹出的半屏小窗（选规格、填地址）	「弹窗补充信息」

它们之间靠一套叫小程序 MCP 的协议串起来。你不用懂协议细节，只要把「技能」按规矩写好，小微后台的大模型就能自己推理：该调哪个接口、填什么参数、什么时候出卡片。

WeStoreCafe 这个点单技能，拆出来是 10 个原子接口 + 6 个卡片组件，覆盖「推荐 → 搜索 → 选规格 → 填地址 → 下单 → 支付 → 查门店」全流程。

2.2 一次「点杯拿铁」，背后发生了什么

用户说「点一杯 WeStore 拿铁，少糖」，这句话在系统里是这么跑的：

用户：「点一杯 WeStore 拿铁，少糖」
  ↓ 上行
小微后台：加载 SKILL → 大模型推理：该调 searchDrinks
  ↓ 下发接口调用
客户端：执行原子接口 → 请求商家服务器拿到饮品数据
  ↓ 回传
小微后台：推理 → 下发「渲染卡片」指令
  ↓
客户端：渲染饮品卡片 → 用户点选 → 确认规格 → 拉起微信支付
  ↓
完成，全程没离开对话框

注意这里的分工：大模型负责「想」（推理调哪个接口），你的代码负责「做」（执行业务、返回数据），微信客户端负责「渲染」（出卡片）。 你要写的，就是中间那层「做」和「渲染」。

2.3 真正的狠料：怎么「管住」这个大模型

到这儿才是开发者最该看的部分。大模型是个概率机器，你不管它，它就会瞎填参数、跳步骤、编数据。微信官方在《最佳实践》里把「怎么驯服它」讲得非常细，挑三个最有冲击力的：

狠料一：信息源是有「注意力权重」的，写错地方等于白写。

模型在做决策时，会同时读好几处文字，但它们的权重天差地别：

信息源	注意力	该写什么
接口返回的 `content`	★★★★★	本次结果 + 下一步动作
接口声明的 `description`	★★★★	这个接口干嘛、什么时候调
参数的 `inputSchema.description`	★★★★	这个参数怎么填、缺省怎么办
`SKILL.md`	★★★	跨接口的业务流程和铁律

很多人习惯把所有说明一股脑写进一个大文档，结果模型根本「注意」不到。正确做法是哪个权重高写哪儿。

狠料二：「事实 + 动作」两段式。

接口返回给模型的话，不能只说「接下来展示订单卡片」，得先陈述事实、再给动作。看官方 demo 里 searchDrinks 真实返回的文案：

已搜索到 3 款匹配「拿铁」的饮品。接下来为用户展示搜索结果卡片，
用简短话术引导用户从卡片中选择，禁止以纯文本列出饮品详情。

先「已搜到 3 款」（事实），再「展示卡片 + 别用纯文本列」（动作 + 禁令）。少了前半句，模型可能把「展示卡片」误读成「准备调下一步」，直接跳过等用户确认。

狠料三：堵死错误退路，每条禁令配一个出口。

最骚的是失败分支的写法。还是 demo 里的真实代码，没搜到饮品时它这么回：

未在商品库中匹配到包含「圣诞限定款」的饮品记录。
禁止编造商品名再次调用本接口，禁止使用空关键词兜底搜索。
正确出口：引导用户换个关键词，或调用 getRecommendedDrinks 展示推荐。

陈述事实 + 指出禁止动作 + 给出正确出口，三件套齐活。还有参数说明里这种「防编造」的写法：

drinkId：必须来自上游接口返回的 items[].drinkId 原值。
禁止从用户自然语言（如「那个 3 号」）推断，禁止使用示例值。

读到这儿你应该回过味来了：在这套体系里，最值钱的能力不是会写代码，是会给 AI 写「说明书」。 一半是工程，一半是提示词功夫。

2.4 卡片的「紧箍咒」：原子组件限制清单

想做卡片的注意，原子组件不是普通小程序页面，限制很硬：

能用的组件就那几个：image 只接网络 URL、只支持 png / jpg；button 不支持任何 open-type；scroll-view 只能横向滚动。
卡片高度初始化时定死，后续不可改；最小高宽比 4:1，禁止上下滚动。
默认不让发网络请求、不让用定时器，要用得单独声明「实时动态组件」、过审才行。
不支持动画，不支持打开别的小程序。

换句话说，卡片是个「轻量展示位」，复杂交互得靠点击后弹半屏页面去做。设计的时候就得迁就这些规矩，别照搬小程序页面思路。

三、红线在哪：这部分能帮你少踩坑

微信做这套东西，克制得有点反直觉。把红线讲清楚，比讲功能更重要——这也是判断一个团队「懂不懂行」的分水岭。

小微整体是「只读多、动手少」。拿到内测的人反复提到：发消息要确认、打电话要确认、涉及钱的动作处处设卡。半屏页面里，跳公众号、跳视频号、跳别的小程序、跳地图 App、做广告，统统被禁掉。

有个做 AI 的同行说得很到位：「微信 Agent 容易翻车的点，不是回答聪不聪明，而是它进了熟人关系链以后，权限默认给到哪一层。」

一句话点透：微信给 AI 划的，不是能力的上限，是信任的下限。 14 亿用户的信任负担，比任何一个炫酷功能都重。理解了这条，你就理解了它为什么处处要确认、处处设限——也就知道自己接入时，哪些事压根别想碰。

四、那么，现在该做什么？

讲完料，落到行动。分两类人说。

如果你是开发者

第一步，申请内测。 路径：微信公众平台 → 基础功能 → AI 能力，接入模式选「开发模式」申请；或在小程序「微信开发者助手」里的「微信 AI 管理」申请。

第二步，别硬写，用 AI 帮你接 AI。 这是最被低估的一点——微信官方把接入做成了一套给 Coding Agent 用的三件套，配合 CodeBuddy、Claude Code 这类工具：

工具	干嘛的
`wxa-skills-generate`	读你现有的小程序代码，自动生成原子接口和组件
`wxa-skills-validate`	拿开发者工具真实跑一遍，按结果闭环修正
`wxa-skills-eval`	模拟用户对话评测，出通过率 / 覆盖率 / 优化建议报告

也就是说，你对着 Claude Code 说一句「帮我分析这个项目，接入微信小程序 AI 开发模式」，它就能进生成流程。门槛比你想的低，但调优功夫（那套提示词工程）省不掉。 官方建议每个技能至少跑 30 条评测用例。

第三步，先拿一个最小场景跑通。 别一上来封装 30 个技能，挑一个高频、闭环短的场景（查询、点单、预约）先做出来、跑通评测，再扩。

如果你是商家 / 老板

先问自己一个问题：我的小程序，是想「能被调用就行」，还是想「在对话里特别好用」？

我们的判断是：现在卡位的意义，大于现在做得多完美。 等公测放量，用户习惯一旦养成，「在小微里好不好用」会直接变成流量分配。早接入的人，吃的是被小微优先调起的心智。

（到底值不值得接、什么生意适合接，我们单独写了一篇算账的：外贸商家该不该用微信 AI 小程序做对话询盘。）

五、我们的几个判断

这波最让人兴奋的，是「一句话生成小工具」。 当生成 + 分发 + 调用都长在 14 亿人的微信里，独立 AI 应用平台的处境会很微妙。但反过来，对小程序和商家是利好——你不再需要自己抢用户，你只需要让自己「能被那个超级入口调起」。
巨头做 AI，慢未必是坏事。 14 亿人的信任，经不起一次 Agent 乱删消息、乱发朋友圈。微信赌的不是「最聪明的 Agent」，是「最让人放心的 Agent」——它的「慢和克制」本身就是护城河。
对个人开发者，这是个少见的时间窗。 功能内测、文档刚出、绝大多数人没看懂。会写业务编排 + 会给模型写「说明书」的人，现在动手，等于在公测前把位置占了。别人在围观小微聊天，你应该去读那份 skill 文档。

红利从来不属于围观的人，属于看懂规则、动手早的人。

想直接抄近路？

这次扒文档的全过程，我们整理成了一份《微信 AI 接入实战手册》：官方 9 篇文档精编 + WeStoreCafe demo 逐层拆解（10 个原子接口 + 6 张卡片、真实的 mcp.json / SKILL.md 范本）+ 接入自查清单，14 页、免费下载。

👉 领取《微信 AI 接入实战手册》（PDF）

需要接入落地——可行性评估、SKILL 封装、原子接口 / 组件实现、评测调优到上线——也可以直接聊聊你的项目，模酷工程团队替你跑通。

资料来源：微信官方《小程序 AI 开发模式（beta）接入指南 / 运行机制 / 最佳实践 / 评测调试》系列文档；官方开源 demo wechat-miniprogram/ai-mode-demo（WeStoreCafe 点单场景）；腾讯 2026 Q1 业绩报告（微信合并月活 14.32 亿）。

延伸阅读