SEO新手入门教程(六):SEO友好的URL 结构和XML站点地图
一、SEO友好的URL 结构
1.将 URL 标准化为小写
URL 通常以小写“like-this-dot-com”书写,而不是混合大小写“Like-That-Dot-Net”或全大写“LIKE-THIS-DOT-BIZ”。保持 URL 标准化将有助于防止网站内部和网站外部的链接错误。
2.使用连字符,而不是下划线
始终使用连字符 (-) 而不是下划线 (_),因为当 URL 作为裸链接发布时看不到下划线。
3.在分类 URL 结构中使用准确的关键词
使用不太相关的关键字作为类别名称是选择流量最多的关键字时常见的错误。有时,流量最高的关键字不一定是类别中页面的内容。请选择与正在寻找这些类别中包含的内容或产品的用户最相关的单词。
4.避免在 URL 结构中使用多余的单词
有时,CMS 可能会将单词 /category/ 添加到 URL 结构中。这是不受欢迎的 URL 结构。没有理由使用类似于 /category/widget/ 的 URL 结构。它应该只是/widget/。
5.用于 SEO 目的的 URL
虽然 Google 越来越多地不在 SERP 中显示 URL,但 Bing 和 DuckDuckGo 等流行搜索引擎仍然会显示它们。保持 URL 较短可以使用户友好且更易于共享。
二、XML站点地图
1.什么是 XML 站点地图?
简单来说,XML 站点地图是网站 URL 的列表。它充当路线图,告诉搜索引擎哪些内容可用以及如何访问这些内容。虽然不能保证 XML 站点地图会让您的页面被抓取,或者提升索引或排名,但提交地图肯定会增加您的机会。使用所有可用标签的单页网站将具有以下 XML 站点地图:
- Loc(又名位置)标签,此强制标记包含 URL 位置的绝对、规范版本,它应该准确反映您的网站协议(http 或 https)以及您是否选择包含或排除 www。
- Lastmod(又名上次修改)标签,一个可选但强烈推荐的标签,用于传达文件的上次修改日期和时间。最后修改时间对于内容网站尤其重要,因为它可以帮助 Google 了解您是原始发布者。传达新鲜感也很有效,但请确保仅在做出有意义的更改时才更新修改日期。准确使用 Lastmod 标签,并将注意力集中在确保提交正确的 URL 上。
- Changefreq(又名更改频率)标签,“更改频率对于站点地图来说并没有真正发挥那么大的作用”,并且“最好直接指定时间戳”。
- Priority Tag 优先标签,这个可选标签表面上告诉搜索引擎一个页面相对于其他 URL 的重要性,范围在 0.0 到 1.0 之间,重要性不强,可忽略。
2.为了使搜索引擎能够轻松地一次找到您的每个站点地图文件,您需要:
- 将您的站点地图索引提交到 Google Search Console 和 Bing 网站管理员工具。
- 在 robots.txt 文件中指定站点地图索引 URL。当您欢迎搜索引擎抓取时,将其直接指向您的站点地图。
3.通过仅包含 SEO 相关页面,您可以帮助搜索引擎更智能地抓取您的网站,以获得更好的索引的好处。您应该排除:
- 非规范页面。
- 重复的页面。
- 网站搜索结果页面。
- 回复评论网址。
- 通过电子邮件 URL 共享。
- 存档页面。
- 任何重定向 (3xx)、缺失页面 (4xx) 或服务器错误页面 (5xx)。
- 被 robots.txt 阻止的页面。
- 对用户有用的实用程序页面,但不打算作为登陆页面(登录页面、联系我们、隐私政策、帐户页面等)
4.充分利用站点地图报告
解决任何“错误”或“有效但有警告”问题。这些通常源于相互冲突的机器人指令。如果问题已解决,请务必通过覆盖率报告验证您的修复。
查看指数化趋势。大多数网站都在不断添加有价值的内容,因此“有效”页面(即被 Google 索引的页面)应该稳步增加。
选择“有效”并查看“已索引,未在站点地图中提交”类型的详细信息。您和 Google 在这些页面的价值上存在分歧。例如,您可能尚未提交隐私政策 URL,但 Google 已将该页面编入索引。在这种情况下,无需采取任何操作。您需要注意的是索引 URL,这些 URL 源于不良的分页处理、不良的参数处理、重复的内容或页面被意外地排除在站点地图之外。
被排除的站点地图 URL 的原因可分为四类处理:
(1)对于重复内容、规范、机器人指令、40X HTTP 状态代码、重定向或合法性排除,采取适当的修复措施。
(2)对于“已提交的 URL 已删除”和“抓取异常”排除项,请使用 Fetch as Google 工具进一步调查。
(3)对于“已爬网 – 当前未编入索引”页面,请检查页面(或页面类型,因为通常会是许多类似品种的 URL)内容和内部链接。很可能它的内容贫乏、非原创或者是孤立的。
(4)对于“已发现 – 当前未编入索引”的页面,Google 指出了排除的典型原因,因为它们“尝试抓取 URL,但网站已超载”。别被愚弄了。更有可能的是,由于内部链接不佳或从域中看到的内容质量较低,谷歌认为“不值得付出努力”进行抓取。如果您看到大量此类排除项,请检查您通过站点地图提交的页面(或页面类型)的 SEO 价值。