一个独立开发者做了个叫 Potatometer 的工具——它可以扫描一个网站,检测 AI 爬虫能不能正常读取它的内容。然后他用这个工具扫描了 Y Combinator 最新一期(2026 春季)的全部 197 个创业公司的网站。
结果出乎意料,也暴露了一个很多人忽略的问题。
197 个 YC 项目,91% 的网站 AI 爬虫可以访问。听起来不错,对吧?
但继续往下看就不太妙了:只有 50% 的网站做了结构化数据标记。也就是说,AI 能读到内容,但有一半的网站 AI「看不懂」这到底是什么——是产品页面还是博客文章?有什么功能?定价多少?
更扎心的是:只有 19% 使用了 FAQ 结构化数据。这意味着当用户用 AI 搜索「XX 工具能做什么」的时候,大部分创业公司连递答案的机会都没给自己。
还有 1/11 的网站是空壳 HTML——真正的内容被锁在 JavaScript 后面,对 AI 爬虫来说就是一张白纸。另有 9% 的网站(18 家)直接屏蔽了 GPTBot 和 ClaudeBot。有些可能是故意的,但有相当一部分只是框架默认行为,开发者自己都不知道。
几个月前我在做一个小工具,上线之后发现 Google 搜索一直没有收录。查了半天问题出在——我的 Next.js 项目用了客户端渲染,页面内容要等 JS 执行完才出现。Googlebot 能等,但很多 AI 爬虫不等。
后来我加了服务端渲染和 JSON-LD 结构化数据,情况立即改善。不光 Google 开始收录了,用 ChatGPT 搜索时也能搜到我的工具了。
对我们独立开发者来说,有两点值得注意:
第一,AI 搜索正在成为新的流量入口。 我自己现在找工具的习惯:先问 ChatGPT「有没有一个能帮我做 X 的工具」,而不是去 Google 搜关键词。这个迁移正在发生,而且速度很快。如果你的网站内容不能被 AI 爬虫正确解析,你就等于在关掉一个越来越重要的流量来源。
第二,结构化数据的 ROI 极高。 加上 JSON-LD 可能就花你一下午,但效果是长期的。FAQ Schema、Product Schema、HowTo Schema——这些是 AI 最偏爱的数据格式。Potatometer 的数据显示连 YC 项目都只有一半做了,你做就立刻领先。
如果你也在做独立产品,花 30 分钟做这几件事:
1. 检查 robots.txt —— 确认没有无意中屏蔽 AI 爬虫。去你的 /robots.txt 看看,有时候框架生成的文件会默认加上 Disallow: / 给所有爬虫。
2. 测试 JS 渲染 —— 用 curl 或者浏览器的「查看网页源代码」看看。如果看到的是 <div id="root"></div> + 一堆 script 标签,你的内容对 AI 就是不可见的。考虑加上服务端渲染或者预渲染。
3. 添加结构化数据 —— 用 Google 的结构化数据测试工具,或者直接在 <head> 里嵌入 JSON-LD。哪怕只是 Product Schema 加上名称和描述,也远比什么都没有强。
4. 至少看一眼 Potatometer 的报告 —— 他们的博客有完整的 YC 数据分析,即使不认同他们的结论,也能启发你对「AI 可读性」的思考。
做独立开发容易陷入的思维定势是:把产品做出来→推给用户。但「用户能不能找到你」这件事,在 AI 时代和以前完全不一样了。
以前做 SEO,核心是关键词排名。现在做 AI 搜索优化,核心是变成 AI 能理解的结构化信息。这不是什么高大上的技术活——就是加几行标记、改一个渲染模式、检查一下爬虫规则。但你做了,和没做,在 AI 眼中的差距可能是「存在」和「不存在」。
周末打算把我的几个小项目都跑一遍 Potatometer,查漏补缺。如果你也有 side project,不妨也试试。
毕竟,产品做出来了,总得有人——不管是人还是 AI——能找到它,对吧?

优网科技秉承"专业团队、品质服务" 的经营理念,诚信务实的服务了近万家客户,成为众多世界500强、集团和上市公司的长期合作伙伴!
优网科技成立于2001年,擅长网站建设、网站与各类业务系统深度整合,致力于提供完善的企业互联网解决方案。优网科技提供PC端网站建设(品牌展示型、官方门户型、营销商务型、电子商务型、信息门户型、微信小程序定制开发、移动端应用(手机站、APP开发)、微信定制开发(微信官网、微信商城、企业微信)等一系列互联网应用服务。
公安局备案号:
