了解 Google Search Console 中 URL 状态“已抓取 – 当前未编入索引”的含义。可能导致为页面设置此状态的一些常见问题,以及如何修复它们
Google 没有直接说明页面为何显示这个状态,通过情况下Google认为这些页面还没有达到被编入索引的条件
1. 如何修复已爬网 – 当前未编入索引
如果您的网站内部链接结构不佳或页面没有内部链接,Google 可能会认为该页面不值得编制索引。没有任何链接指向它的页面称为孤立页面
修复孤立页面的方法:改进内部链接结构,请首先转到您网站上的现有页面,找到您希望 Google 索引的主题页面相关的文章部分,然后添加一个链接
可以通过在 Google 中对孤立页面(orphan page)所针对的关键字进行基于站点的搜索来进行内部链接机会。Google 中的查询格式为:Site:yourdomain.com ‘孤立页面目标关键字’
Site:yourdomain.com ‘孤立页面目标关键字’

搜索结果将是你网站中已经使用目标关键字并可能提供内部链接机会的页面,内部链接是必不可少,不要忽视它,它有助于显示该页面是相关性
2. 内容薄/低质量的内容
字数少的页面可能缺少信息,被 Google 视为内容薄弱。如果是这种情况,他们可能会抓取该页面,但会将其从搜索结果页面中排除
当你的页面的字数明显少于其他页面时,就会出现内容稀少的情况。例如,如果所有搜索结果页都有超过 3000 个字的深入解释,那么您的 100 个字的页面很可能被认为是稀薄的内容。
如果顶部页面具有不同内容长度的混合结果,则具有 100 多个单词的页面可能不会出现内容稀少的问题
通常用于修复精简内容的解决方案:是向页面添加更多信息,使页面足够信息全面涵盖该主题,而不必使其过长。做出一篇精炼而完整的文章,受到读者的重视,谷歌就会给予高排名奖励
PS:Google 不会告诉您某个页面的内容稀少或质量低下,您应该检查搜索结果并判断你的页面质量
3. 搜索意图 (Search Intent)
“已抓取 – 当前未编入索引”页面的另一个原因可能是搜索意图不匹配, 这意味着您的内容与搜索结果中的内容之间存在差距
以下是搜索意图如何影响“如何计算税款”查询的排名的示例:
信息性的,结果有好有坏,包括税款计算器、视频和“操作方法”文章。因此,当您定位此查询时,您可能会成功使用不同的内容类型。
当定位查询“税计算器”时,使用计算器工具比使用“操作方法”文章更有利于参与排名收录
为确保您确定搜索意图,我们在创建内容之前检查 Google 第一页上的页面排名
解决页面不索引问题– 目前由于搜索意图不匹配而未编入索引的解决方案:是重写或更改页现在页面上的内容
4. 内容几乎重复的页面
正如我们在“已发现 – 当前未编入索引”指南中所见,Google 希望提高其资源和抓取预算的效率。谷歌不喜欢的一件事是重复的内容
重复内容不会受到处罚,但这并不意味着谷歌会将其编入索引。事实上,他们不想索引重复的内容。但是,如果 Google 认为您网站上的某个页面是重复的,他们会怎么做?最有可能的是,该页面将被标记为“已抓取 – 当前未编入索引”
可能发生重复内容的情况:
- 电子商务网站,同一产品有很多变体,产品描述很短
- 具有大量用户生成内容的网站
- 网站上接近相同或相似主题的页面
谷歌希望避免自同一网站的重复页面编入索引,以改善用户体验。所以谷歌过滤掉了一些结果
可以在Google serach Console 检查性能报告以查看哪些页面已经关键词满足用户意图参与排名,可以在这些页面增加内部链接到新的文章页面
当页面有类似的主题时,考虑添加一个规范标签 (canonical tag)来告诉 Google 可以只索引其中一个。使用此标签,您可以告诉 Google 哪个页面最相关以及您希望将哪个页面编入索引。一般情况下他们尊重规范标签。
如果您认为页面不相似或者您不想使用规范标签,可以考虑更改其中一个页面的内容,避免重复
5. 结构化数据不匹配 (Structured data mismatch)
结构化数据有助于搜索引擎了解页面的内容这对于销售实体产品的电子商务网站尤其重要。
当产品可用性发生变化时,这有助于电子商务网站的一个示例。如果您更改结构化数据以显示产品有货/缺货,您还需要更改结构化数据以反映当前的库存情况。具有令人困惑的信号可能会导致 Google 抓取这些页面,但不会将这些页面编入索引。
提供了有关如何帮助 Google 处理缺货产品的建议。他提供了几种解决方案,如果您使用正确的信息更新页面,Google 可以处理更新这些变化。
6. 其他因素
误报:是当 Google Search Console 报告页面被排除,但 URL 检查工具或测试实时 URL 显示您的页面已编入索引,在 Google Search Console 覆盖范围内,这种情况被视为误报
在Google search console中 进行实时 URL 测试:
1. Google.com 并将您的页面 URL 作为查询,例如,domain.com/your-blog-post
2. 然后查看结果并查找您的页面 URL
如果您的页面出现在搜索结果中,则表示该页面已编入索引,即使在 Google Search Console 中显示该页面已被排除。这就是所谓的误报
可以借助Google 插件定位查询:SEO Search Simulator by Nightwatch

如果您的页面出现在搜索结果中,则表示该页面已编入索引,即使在 Google Search Console 中显示该页面已被排除。这就是所谓的误报。
在这种情况下,您无需执行任何操作,因为这只是来自 Search Console 的报告错误
7. 分页网址
博客和电子商务商店可能会使用分页来分隔内容并使其易于导航,分页 URL 是末尾带有数字的页面 – 例如www.myDomain.com/blog/page/2
Google 可能会决定不将这些页面编入索引。您是否决定尝试使用分页 URL 来解决此问题,将取决于您是否在搜索结果中看到它们的价值。分页 URL 是否真的会为任何东西排名?
查看 Google 的分页最佳实践或本指南关于SEO 的分页
8.常见问题
常见问题
“已抓取 – 当前未编入索引”是错误吗?
不是错造成的。已爬网 – 当前未编入索引是搜索结果中的排除状态。您是否需要对页面采取任何行动将取决于您基于内部链接、内容质量和上面讨论的其他问题对页面的查询结果

在哪里可以找到已爬网页 – 目前未编入索引?
您可以在已排除选项卡的覆盖率报告中找到状态为“已抓取 – 当前未编入索引”的页面

为什么我的网页没有被 Google 索引?
谷歌可能不索引您的网页的原因有很多。
您可以执行以下操作以使其被 Google 索引:
- 使用 Google Search Console 上的 URL 检查工具查看是否可以将页面编入索引
- 请上面的步骤进行操作,过几天再看一下