Hugo在生成网站时会默认为用户生成对应的RSS文件,然而Hugo默认生成的RSS订阅源中包含文章的所有内容。虽然这样能极大程度上得给用户提供便捷,但同时会增长文章被爬虫盗取致使版权问题的风险。html
所以本文的主要内容是介绍如何自定义Hugo的RSS模板。git
本文首发于个人我的博客 技术公馆(wcc.im): 自定义Hugo的RSS模板
RSS全称为Really Simple Syndication,是一种简单易用的为用户提供信息聚合方式的规范。其语法相对简单且受到的支持较为普遍,所以很是适合于博客、新闻等网站。segmentfault
RSS的语法在此就再也不赘述,想要具体了解的读者能够查看个人另外一篇文章RSS语法简介。post
根据每一个人选择的主题的不一样,RSS代码可能略有不一样,但异曲同工一通百通。网站
我目前使用的是Academic主题,Academic主题中的RSS模板位于themes/academic/layouts/_default/rss.xml
,模板内容以下所示:ui
{{- /* Generate RSS v2 with full page content. */ -}} {{- /* Upstream Hugo bug - RSS dates can be in future: https://github.com/gohugoio/hugo/issues/3918 */ -}} {{- $page_context := cond .IsHome site . -}} {{- $pages := $page_context.RegularPages -}} {{- $limit := site.Config.Services.RSS.Limit -}} {{- if ge $limit 1 -}} {{- $pages = $pages | first $limit -}} {{- end -}} {{- printf "<?xml version=\"1.0\" encoding=\"utf-8\" standalone=\"yes\" ?>" | safeHTML }} <rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"> <channel> <title>{{ if ne .Title site.Title }}{{ with .Title }}{{.}} | {{ end }}{{end}}{{ site.Title }}</title> <link>{{ .Permalink }}</link> {{- with .OutputFormats.Get "RSS" }} {{ printf "<atom:link href=%q rel=\"self\" type=%q />" .Permalink .MediaType | safeHTML }} {{ end -}} <description>{{ .Title | default site.Title }}</description> <generator>Source Themes Academic (https://sourcethemes.com/academic/)</generator> {{- with site.LanguageCode }}<language>{{.}}</language>{{end -}} {{- with site.Copyright }}<copyright>{{ replace (replace . "{year}" now.Year) "©" "©" | plainify }}</copyright>{{end -}} {{- if not .Date.IsZero }}<lastBuildDate>{{ .Date.Format "Mon, 02 Jan 2006 15:04:05 -0700" | safeHTML }}</lastBuildDate>{{ end -}} {{- if .Scratch.Get "og_image" }} <image> <url>{{ .Scratch.Get "og_image" }}</url> <title>{{ .Title | default site.Title }}</title> <link>{{ .Permalink }}</link> </image> {{end -}} {{ range $pages }} <item> <title>{{ .Title }}</title> <link>{{ .Permalink }}</link> <pubDate>{{ .Date.Format "Mon, 02 Jan 2006 15:04:05 -0700" | safeHTML }}</pubDate> <guid>{{ .Permalink }}</guid> <description>{{ .Content | html }}</description> </item> {{ end }} </channel> </rss>
能够看到其中就是较为清晰明了的RSS文件格式。为了防止爬虫经过RSS盗取文章内容,我但愿将RSS中的正文替换为摘要部分,并为读者增长跳转到原文的连接。atom
在Hugo官网上咱们能够了解到Hugo在生成RSS文件时模板的查询顺序以下所示:url
[layouts/index.rss.xml
layouts/home.rss.xml layouts/rss.xml
layouts/list.rss.xml layouts/index.xml
layouts/home.xml layouts/list.xml
layouts/_default/index.rss.xml
layouts/_default/home.rss.xml
layouts/_default/rss.xml
layouts/_default/list.rss.xml
layouts/_default/index.xml
layouts/_default/home.xml
layouts/_default/list.xml
layouts/_internal/_default/rss.xml]
所以咱们只要在项目路径下的layouts/_default
文件夹(如不存在该文件夹则按照路径建立便可)中新建一个rss.xml
文件,并写入咱们但愿的模板便可。code
经过对Academic默认RSS模板代码的阅读咱们能够发现,在每个<item>
中,其<description>
代码为:
<description>{{ .Content | html }}</description>
能够看到其默认状态下放入的为文章的内容,咱们只需将.Content
替换为.Summary
便可只在RSS中加入摘要。
同时咱们为了令读者能轻松便捷地阅读全文,还应加入一个阅读原文的连接。原文的连接能够经过.Permalink
进行获取。
然而因为个人博客是一个双语博客,“阅读全文”的提示应该能根据语言进行变化,而不能仅仅将其写为字符串。好在Hugo支持多语言,所以咱们能够经过此实现多语言提示。
在Academic主题默认的i18n文件中正好有id为more_pages
的一项对应“查看所有”,所以能够直接在模板中使用这一项。在Hugo中只要使用{{i18n "more_pages"}}
便可表明此处是id为more_pages
的值。
综合以上多种修改,咱们只需将
<description>{{ .Content | html }}</description>
改成
<description>{{ .Summary | html }}{{ printf "<br />" }}{{i18n "more_pages"}}: {{ .Permalink }}</description>
便可。
RSS本应是一种为读者提供方便的信息聚合的方式。然而因为爬虫的泛滥,使得人们不得不对RSS的内容进行保护,也所以不得不在必定程度上损伤了读者的便利性。其中的平衡还需不断进行调整。
本文首发于个人我的博客 技术公馆(wcc.im)。
原文连接: https://wcc.im/zh/post/hugo-rss-template/
本博客内文章除特别声明外均为原创,采用 CC BY-NC-SA 4.0 许可协议进行许可。超出 CC BY-NC-SA 4.0 许可协议的使用请联系做者得到受权。