llms.txt:跨境圈卖得最凶的 AI 优化,目前不值一分钱
有服务商在推销「llms.txt 生成与优化」,报价从几百到几万。但实测数据、官方表态、协议现状三方面都指向同一个结论:这个文件目前不会带来任何可测量的 AI 流量。这篇讲清楚为什么,以及钱该花在哪。
先说结论,省你五分钟:
如果有服务商向你推销「llms.txt 生成与优化」,无论报价 800 还是 8 万,都可以直接划走。这个文件目前不会给你带来任何可测量的 AI 流量变化。
过去大半年,我们一直在研究一个问题:跨境独立站怎么才能被 ChatGPT、Perplexity 这些 AI 推荐。期间扒了能找到的几乎所有公开数据和实验,也做过一个英文市场的 AI 可见性诊断工具。这篇先把市面上最大的一个伪概念拆掉。
llms.txt 是什么,为什么它听起来那么合理
2024 年 9 月,Answer.AI 的 Jeremy Howard 提了一个社区提案:在网站根目录放一个 llms.txt 文件,用 Markdown 格式告诉大语言模型「我这个站是干嘛的、重点内容在哪」。类比 robots.txt——后者告诉爬虫不能看什么,llms.txt 告诉 AI 应该看什么。
逻辑上无懈可击,对吧?AI 时代的站点说明书,提前布局,先发优势。
服务商也是这么卖的。Shopify 应用商店里光是 llms.txt 生成器就有一打,月费 9 到 29 美元不等;国内不少 GEO 服务商把它打包进几千到几万元的「AI 优化套餐」里,话术通常是「完成 llms.txt 布局,进入 AI 推荐名单」。
问题只有一个:没有任何一家 AI 公司在用它。
三组证据
证据 1:实测数据——0.1%
AI 可见性监测公司 Otterly(Gartner 2025 年度 AI 营销 Cool Vendor)做过一个目前最干净的实验:在一个正确部署了 llms.txt 的网站上,统计了 3 个月、超过 6 万次 AI 爬虫访问。
结果:llms.txt 只被请求了 84 次,占全部 AI 爬虫访问的 0.1%。同一个站上,一个普通页面的平均 AI 爬虫访问量是 265 次。换句话说,这个号称「AI 专属入口」的文件,被 AI 爬虫光顾的频率,还不如一个随便的 PDF 附件。
证据 2:官方表态——零承诺
截至 2026 年第一季度,OpenAI、Google、Anthropic、Meta、Mistral,没有任何一家公开承诺在生产系统中读取或采信 llms.txt。
Google 的态度尤其值得看。官方明确表示:其生成式 AI 搜索功能基于核心搜索排名与质量系统,不需要 llms.txt,搜索团队的 John Mueller 也公开表过态。中间还有个插曲:有人发现 Google 自家某些站点上出现了 llms.txt,圈内一度以为是官方暗示,后来证实只是内部 CMS 自动生成、团队懒得删而已。
GPTBot 偶尔会抓取这个文件?是的。但「被抓取」和「影响推荐」是两回事——你网站的 favicon.ico 也天天被抓。
证据 3:协议层——它甚至不是一个标准
robots.txt 背后有近三十年的事实标准地位和搜索引擎的一致遵守。llms.txt 呢?没有 W3C,没有 IETF,没有任何标准组织背书,是一个纯靠自觉的社区提案——没有强制力、没有验证机制、没有任何一个主流消费方。
更根本的是:AI 答案引擎(ChatGPT 搜索、Perplexity、Google AI Overviews)的检索,走的是传统搜索索引 + RAG 那一套——它们抓取和评估的是你的真实网页,根本不需要一个平行的「AI 专用入口」。
那为什么所有人都在卖它?
因为它是一个完美的收割品:
- 看起来像技术活。 一个放在根目录的神秘文件,普通卖家无从判断真假。
- 做了无法证伪。 AI 流量本来就在涨,装了 llms.txt 之后流量涨了,服务商说是文件的功劳,你怎么反驳?
- 成本约等于零。 让 AI 生成一份 llms.txt 是几秒钟的事,收你几千块,毛利率高得离谱。
顺手再说一个更离谱的话术。有些建站服务商宣称:完成 GEO 优化后「通过各大生成式 AI 平台收录审核,进入智能货源推荐名单」。不存在任何「AI 平台收录审核」,也不存在什么「推荐名单」。 ChatGPT 不设审核入口,Perplexity 没有提交通道。这套话术是把百度竞价时代的心智原样平移到 AI 上,编出了一个根本不存在的机制。看到这种表述,直接划走即可。
公允地说一句
llms.txt 本身无害。自己花五分钟生成一个放上去,成本为零,万一两年后真有哪家 AI 开始采信,你也不亏。所以完整的建议是两条:
- 可以放,但不要为它付一分钱;
- 不要把任何流量变化归因给它——归因错了,你后面所有的优化决策都会跟着错。
真正决定 AI 推不推你的,是这三件事
打假不是目的。AI 流量这个渠道本身是真的,而且质量高得离谱(Adobe 的数据:2026 年 3 月,美国零售网站的 AI 来源流量转化率已反超普通流量 42%,一年前还低 38%)。问题只是钱该花在哪。根据目前能找到的大样本研究,真正起作用的是三层:
- 第一层:爬虫可达性。 你的站得先让 AI 的爬虫进得来。这一层的坑大到超出想象——Cloudflare 从 2025 年 7 月起对新域名默认屏蔽所有 AI 爬虫,而跨境独立站几乎人手一个 Cloudflare。很多店 Google 排名好好的,在 AI 世界里却是隐身状态。(完整自查方法见:你的独立站可能正对 ChatGPT 隐身)
- 第二层:第三方引用。 一项覆盖 3000 万条 AI 引用源的分析显示:Reddit 是 ChatGPT、Gemini、Perplexity、Google AI 全平台引用第一的来源,YouTube、维基、专业测评站排前五。AI 推荐商品时,压倒性地采信别人怎么说你,而不是你自己怎么说。这意味着 GEO 的主战场其实在站外——这恰好是大部分中国卖家的盲区。
- 第三层:结构化数据和产品 feed。 AI 要能机器级地读懂你的价格、规格、库存、评分。这层是纯技术活,有标准答案。
写在最后
llms.txt 不是技术问题,是认知问题——它精准利用了「不懂、又怕错过」的焦虑。把这份焦虑换成上面那三件真正有用的事,钱才花在刀刃上。需要有人帮你把 AI 可见性这条链路从头到尾跑一遍,聊聊你的站。
数据来源:Otterly.ai llms.txt 三个月实测;Google 官方生成式搜索指南及 John Mueller 公开表态;Adobe Digital Insights 2026 Q1 零售数据;Search Engine Land 报道的 3000 万 AI 引用源分析(2026.3)。
延伸阅读