最近一直在利用喝茶时间消化 LLMs Search 相关内容,今天这篇文章简单分享下这类大模型搜索的工作流程。
有兴趣的朋友,可以关注下这次 Claude 4 更新时泄露出来的系统级 Prompt,这对于我们理解 AI Search 的工作原理有很多帮助。
且这类信息都是第一手资料了,非常有价值。
言归正传,其实大模型搜索与传统搜索的工作流程根本上就是两套逻辑,没有什么共同性。
比如我们现在写了一篇文章,然后发布到自己的网站。
传统搜索引擎的爬虫会到我们的网站上,抓取这篇文章的信息,然后通过切片分词、相关性分析、排名等一系列操作,将我们的内容收录到他们的索引数据库中。
那后续用户在搜索某个关键词时,一旦其搜索词与我们的文章内容有匹配出相关性,搜索引擎就可能会将我们的内容展示在用户面前(会根据各维度的指标给一个初始的排名)。
而用户看到搜索结果页后,可能会去点击我们的文章,也可能不会点击,毕竟页面上的内容实在有很多。如果你的标题内容与描述内容与用户的搜索意图不相关的话,大概率用户不会点击到你的网站。
其实上面这样的流程,就是传统搜索的大致工作流程,而这样的流程完全不适用大模型搜索。
根据这次 Claude 泄露出来的系统级 Prompt 信息,可以看到大模型搜索流程似乎是更简单了。
首先大模型搜索没有索引库,它不会提前收录你的内容并做一系列初始操作,这点与传统搜索完全不一样。
但是因为大模型都是用数据训练出来的,在进行数据训练之前就已经抓取了非常多的数据,由此它们在前期就积累了非常多的原始信息。
其次大模型搜索会将用户的搜索行为大致分为四类,分别是 never_search、do_not_search_but_offer、single_search,与 research。
比如我们现在搜索“美国的首都是哪里”这个词条,由于这类信息基本是固定不变的,也就是我们通常意义上所说的信息词,于是这类词条便大致归入 never_search 这个分类。
大模型搜索的处理逻辑就是直接在自己的数据集中,找到这个问题的答案并直接呈现给用户,这个过程基本就是一个内部信息的搜索查询,根本不会触发外部信息的搜索。
类似 do_not_search_but_offer 这个分类,如果用户搜索一些固定频率更新的信息时,大概率会触发这个分类的搜索逻辑。
比如用户搜索“美国的人口是多少”,这个数据在大模型的数据集里大概率会存在,但数据可能并不是最新的。于是大模型就会直接去某个权威网站上,获取最新的数据并直接呈现给用户。
至于 single_search 与 research 这两个分类的处理逻辑基本趋同,区别是处理简单搜索还是复杂搜索。
比如“昨天 NBA 总决赛的比分”与“分析下昨天两支球队的技战术策略”这样的词条,可能就会分别触发这两个分类的搜索逻辑。至于分析过程中的具体信息获取,可能就会触发更多的外部信息搜索了。
所以从上面的工作流程对比中,我能清晰发现 SEO 与 GEO 工作重心的不同。
在 SEO 时代,我们的主要工作任务是写出符合用户需求的内容,然后尽可能获取高相关高权重的外链,来得到更高的自然搜索排名。
而 GEO 时代的逻辑变了,我们的任务重心变成了如何让 AI 模型更多引用我们的网站内容。

优网科技秉承"专业团队、品质服务" 的经营理念,诚信务实的服务了近万家客户,成为众多世界500强、集团和上市公司的长期合作伙伴!
优网科技成立于2001年,擅长网站建设、网站与各类业务系统深度整合,致力于提供完善的企业互联网解决方案。优网科技提供PC端网站建设(品牌展示型、官方门户型、营销商务型、电子商务型、信息门户型、微信小程序定制开发、移动端应用(手机站、APP开发)、微信定制开发(微信官网、微信商城、企业微信)等一系列互联网应用服务。