移除Hugo自动生成sitemap.xml中的无关链接

2020-03-06

介绍

Hugo呢之前已经介绍过了,我的这个博客网站就是用Hugo生成的,也可以参看Hugo的官方网站获取更多信息.

sitemap.xml文件则是网站提供给搜索引擎的爬虫工具爬取的网站的目录.

问题摘要

这次我们要解决的问题是在Hugo自动生成的sitemap.xml文件中(sitemap.xml等于是给搜索引擎看的网站的目录),出现了很多无关的,或者我们并不希望被搜索引擎收录的链接,比如说如下图所示:

sitemap.xml中的无关链接

可以看到,出现了/tags,和/tags/*之类的路径,这不论是在搜索引擎中,

在搜索引擎中的效果

还是真正地点进去看,都是非常丑的:

非常丑

问题解决的过程

我们先在搜索引擎搜索关键词: Hugo Sitemap ,然后进入Hugo生成Sitemap的文档页面

Sitemap Templates

layouts/sitemap.xml,

layouts/_default/sitemap.xml

themes/hugo-notepadium/layouts/sitemap.xml,Line 4

  {{- range .Data.Pages -}}

将上列代码修改为

  {{- range .Site.RegularPages -}}

接下来刷新CloudFlare缓存,重新在Google Search Console提交sitemap.xml并移除相关的链接即可.

参考文献

[1] Site Variables | Hugo

[2] Sitemap Template | Hugo

经验交流hugositemap.xmlseo

记我的第一次GitHub Pull Request(上篇)提交与分支

介绍Google LightHouse