XML Sitemaps 站点地图设置

Sitemap 站点地图可以帮助搜索引擎提高抓取预算的效率!

什么是 XML 站点地图?

XML 站点地图是一个文档,其中包含您希望搜索引擎定期抓取的网站中所有 URL 的列表。它们是一种补充工具,用于帮助搜索引擎找到页面并更有效地抓取它们。您可以将站点地图视为带有元数据(如上次更新日期)的路线图,将搜索引擎指向重要页面

单个站点地图文件必须采用UTF-8 编码,最大大小为 50,000 个 URL,未压缩 50MB,以较大者为准。 

站点地图可以压缩为gzip 格式。这些限制可防止服务器不堪重负。如果站点地图达到上述限制,您可以创建 XML 站点地图索引

什么是 XML 站点地图索引?

XML 站点地图索引是一个包含多个站点地图列表的文件。限制是相同的:站点地图索引不能超过 50,000 个站点地图并且小于 50MB,也可以有多个 XML 站点地图索引并使用 gzip 格式压缩它们

网站地图对 SEO 的影响

虽然使用 XML 站点地图并不能保证索引或好的排名,但这些是使用它们的好处:

  • 向 Google 指明您认为重要的页面及其规范版本
  • 页面更新时通知 Google

您还可以通过站点地图查看索引覆盖率报告,可以发现哪些页面索引存在问题,以及如何修复

哪些网站应该使用站点地图?

根据 Google的说法,这些是更需要站点地图的网站类型:

  • 大型网站
  • 具有大量存档但没有适当内部链接结构的网站
  • 外部链接很少的新网站
  • 包含大量富媒体(视频和图片)或在 Google 新闻中展示的网站

注意:站点地图不能替代良好的内部链接结构 (加强内部页面的链接,避免孤立页面,这样的页面Gooogle有时候有难发现爬取)

如何创建站点地图

1. 使用 WordPress 插件创建站点地图

转到 WordPress 插件存找站点地图插件。大多数 SEO 插件都具有此功能,这里使用Rank Math 示范

siteamp 设置
Rank Math 设置Sitemap

2. 使用站点地图生成器创建站点地图

站点地图生成器,例如Screaming FrogSureOak ,如何使用XML-Sitemaps.com 构建站点地图

第一步:进入 XML-Sitemaps 的主页,输入您的网站 URL,然后点击开始

XML-Sitemaps.com 网站地图构建
XML-Sitemaps.com 构建站点地图

第 2 步:它会自动抓取您的网站,生成站点地图详细信息,点查看预览,或立即下载文件

生成站点地图文件
生成站点地图文件

第 3 步:将下载的 XML 文件上传到您的服务器,取决于你的服务器类型

提示:通过生成器创建 XML 文件后使用站点地图验证器,这一步主要验证XML文件是否上传成功

3. XML 站点地图结构

有效的 XML 站点地图必须遵循协议并使用正确的架构。它们应该具有必需的属性和一些可选的属性,站点地图主要是为机器人和搜索引擎爬虫制作的,如下所示:

Sitemap 站点图片标识
XML 文件标识

XML 站点标识

站点地图所需属性的层次结构如下:

-XML header (XML 标头)

  • 站点地图的第一行是 XML 标头。
  • 此标头通知 XML 标准(本示例中为 1.0)和字符编码 (UTF-8),XML 站点地图必须是 UTF-8

URLset (网址集)

  • urlset 属性引用了用于文档的当前站点地图标准(在本例中为 0.9)
  • Urlset 属性应该作为一对使用,一个在标题之后,另一个在文档末尾,在所有 URL 和可选属性之后
  • URL (网址)
  • URL 标签指定您希望爬虫使用的 URL,建议仅列出链接的规范版本
  • URL 是协议中的必需属性,并且是此列表中接下来提到的每个标记的父标记(loc、lastmod、changefreq、priority)

Optional URL elements (可选的 URL 元素)

  • Lastmod 是 URL 的最后修改日期,必须使用 W3C 日期时间格式
  • Changefreq 是页面可能发生更改的预期频率, 接受的值是始终、每小时、每天、每周、每月、每年和从不
  • Priority values 可以介于 0.0 和 1.0 之间,并向搜索引擎显示页面对网站所有者的重要性
<url>

<loc>https://www.moneysavingheroes.co.uk/peacocks</loc>

<lastmod>2020-11-26</lastmod>

</url>

Loc (地方)

  • loc(又名位置)是站点地图中 3 个必需属性中的最后一个。 此标记指的是 URL 的位置。
  • 位置标签 URL 必须以协议(即 HTTPS 或 HTTP)开头,以斜杠结尾,并且长度少于 2,048 个字符

站点地图索引文件结构

XML 站点地图索引必须具有以下元素:

  • XML header(XML 标头):告知使用的 XML 标准和字符编码
  • Sitemapindex:包含使用标准的文件中所有站点地图的元素,类似于 urlset 在单个 XML 站点地图中表示的内容
  • Sitemap(站点地图):此标记包含来自单个 XML 站点地图的信息,例如位置和 lastmod;
  • Loc:标识 XML 站点地图的位置;
  • Lastmod 是 XML 站点地图索引的可选元素。

PS: 此文件只能提及与站点地图索引在同一站点上的站点地图,因此它对子域无效

XML sitemap
XML Sitemap
XML Sitemap Index structure example

<?xml version="1.0" encoding="UTF-8"?>

    <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">

        <sitemap>

            <loc>https://www.domain.com/sitemap-pages.xml

            </loc>

            <lastmod>2022-04-

            19T11:54:44.774Z

            </lastmod>

        </sitemap>

        <sitemap>

            <loc>https://www.domain.com/sitemap-posts.xml

            </loc>

            <lastmod>2022-04-25T18:42:55.769Z

            </lastmod>

        </sitemap>

    </sitemapindex>

XML siteamp 操作指南

  • Consistent URLs: 爬虫将使用站点地图中的确切 URL,因此请确保为每个 URL 使用相同的 HTTP 协议和子域/根域。 例如:不要使用 www 和非 www 版本的 URL
  • Only canonical URLs: 如果一个页面有多个版本,请仅使用站点地图中的规范版本。 例如,不要添加电子商务产品变体
  • Use sitemap Indexes: 如果您的站点有超过 50,000 个 URL 或多个站点地图,请使用站点地图索引文件
  • Use hreflang:当 URL 有其他语言版本时,使用 hreflang 标识
  • lastmod: 在站点地图中包含 lastmod 并使其与页面的最后更新日期一致(使用动态站点地图来执行此操作)
  • Dynamic sitemaps:在发布或更新新内容时更新并保持站点地图最新
  • Reference the sitemap in robots.txt: 告诉您的站点地图在 robots.txt 文件中的位置对每个爬虫都有帮助
  • Use sitemaps extensions: 对于拥有大量富媒体的网站,请考虑使用视频站点地图图片站点地图Google 新闻站点地图

在 Google Search Console 提交站点地图

在左侧边栏中,转到“站点地图
在“添加新站点地图”下方输入站点地图 URL,然后按提交
Google Search Console 接受站点地图和站点地图索引

Google search console 提交站点地图
Google search console 提交站点地图

PS:使用站点地图是您的决定,因为它们不保证索引。但是站点地图可以帮助搜索引擎提高抓取预算的效率。即使它们不是强制性的,它们也是有帮助的

给TA买糖
共{{data.count}}人
人已赞赏
SEO

Google Search Console (A~Z)详细讲解

2022-6-4 15:28:11

SEO

已发现 - 当前未编入索引

2022-6-5 7:39:54

2 条回复 A文章作者 M管理员
  1. 未名游客给您打赏了¥10
  2. 未名游客给您打赏了¥10
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索