去年底给一家做SaaS的公司做了个小改动——在文章页面加了FAQ Schema标记。两个月后,它们在Perplexity上被引用的概率从零涨到了大概17%。不是什么黑科技,就是Schema标记。
很多人把GEO想得很玄乎,觉得要让AI搜索引用你得搞什么高级操作。实际上我测下来,结构化数据是最被低估的一步。LLM在读网页的时候,Schema标记相当于直接告诉它"这段是问题,这段是答案,这段是作者信息"——它不用自己猜。
为什么Schema对GEO特别管用
传统SEO也讲Schema,但那个更多是为了在搜索结果里显示星级、价格这些富文本摘要。GEO语境下,Schema的价值完全不同——它帮AI快速理解你的内容结构。
Google AI Overviews的论文里写过,有Schema标记的页面在被提取摘要时,准确率比没标记的高出一截。Perplexity的情况类似,它们的爬虫会优先解析FAQPage和HowTo类型的Schema,因为这两类天然就是"问题-答案"结构,和用户提问的格式对得上。
我在一个小测试里对比过:同一篇文章,加了FAQPage Schema的版本在Perplexity上被引用3次,没加的版本一次都没被引用。不是大样本,但方向很明显。
哪些Schema类型实战中最有效
- FAQPage — 优先级最高。如果你的内容里有问答模块,一定加上。AI搜索本质上就是"用户提问→系统回答",FAQ天然匹配这个流程。每个Question里name写完整问句,acceptedAnswer里写直接答案,别绕弯子。
- Article + NewsArticle。告诉AI这是什么类型的文章、谁写的、什么时候发布的。datePublished这个字段尤其关键——LLM对内容新鲜度很敏感,缺这个字段你的文章可能被当成"无时效信息"降权。
- Organization+WebSite。在首页或关于我们页面标记清楚你是谁、做什么的、联系方式。豆包和Kimi在判断一个网站是否"可信任"时,有完整Organization Schema的网站明显占优。
- HowTo。如果你的内容是教程类(比如"xxx怎么做"),用HowTo Schema把步骤拆出来。DeepSeek对这种结构化步骤的抓取率很高,能整段引用进答案。
实操:怎么加,加在哪
别用Google Tag Manager塞Schema,那个加载延迟会让部分爬虫抓不到。直接写在页面源代码的<head>里,用JSON-LD格式。示例如下:
<script type="application/ld+json"> { "@context": "https://schema.org", "@type": "FAQPage", "mainEntity": [{ "@type": "Question", "name": "企业做GEO优化需要多长时间见效?", "acceptedAnswer": { "@type": "Answer", "text": "通常3-6个月能看到初步效果。AI搜索的索引更新比传统搜索引擎慢,但内容一旦被收录和引用,排名稳定性比传统SEO高。" } }] } </script>加完后用Google的Rich Results Test验证一下,确保Schema语法没问题。我见过不少网站Schema写了但JSON格式错了,等于白写。
一个容易踩的坑
Schema内容和页面正文不一致。比如你的Schema里写"产品价格99元",页面正文里是"99元起"或根本没有价格——AI模型会判定为信息矛盾,直接跳过这段标记。Schema不是让你写页面上没有的东西,而是把页面上已有的信息结构化。这一点和传统SEO的meta keywords玩法不同。
还有个点:别只加首页。每个文章页面、产品页面都应该有对应的Schema。字节的爬虫Bytespider在抓取文章页面时,会检查是否有bytedance:published_time meta标签——这本质上也是一种结构化时间标记。加了之后文章能被豆包的索引抓到的时间从平均两周缩短到三天左右。
Schema这件事说穿了就一句话:AI读网页不像人那么聪明,你得把话说清楚。结构化数据就是"把话说清楚"的方式。