若是博客是使用Hexo管理的,sitemap能够使用插件来生成。但对于一个内容管理网站,后端多是express、koa之类的框架,这时sitemap就须要本身来生成了git
Sitemap可方便网站管理员通知搜索引擎他们网站上有哪些可供抓取的网页。最简单的Sitemap形式,就是XML文件,在其中列出网站中的网址以及关于每一个网址的其余元数据(上次更新的时间、更改的频率以及相对于网站上其余网址的重要程度为什么等),以便搜索引擎能够更加智能地抓取网站。github
<url> <loc>http://www.jouypub.com/</loc> <lastmod>2019-05-01</lastmod> <changefreq>daily</changefreq> <priority>0.5</priority> </url>
loc:文章连接地址
lastmod:最后更新时间
changefreq:更新频率,daily/monthly
priority:权重shell
开源包:sitemap,地址: https://github.com/ekalinin/s...express
> npm install --save sitemap
代码中使用npm
const express = require('express') const sm = require('sitemap'); router.get('/sitemap.xml', function (req, res) { let pageRequest = Object.create({}); pageRequest.pageSize = -1; pageRequest.pageNum = 1; api.post('/article/list', pageRequest, function (result) { let urls = []; for (let article in result) { urls.push({ url: article.url, changefreq: 'daily', lastmodrealtime: true, priority: 1, lastmod: article.updateTime }); } let sitemap = sm.createSitemap({ hostname: 'http://invest.jouypub.com', cacheTime: 600000, // 600sec, cache purge period urls: urls }); sitemap.toXML(function (err, xml) { if (err) { console.log(err); return res.status(500).end(); } res.header('Content-Type', 'application/xml'); res.send(xml); }); }); });
上面那种方法在文章数少时还能使用,若是有几千甚至几万篇文章,一次拉取的方式就不适合了,就须要把返回结果写入到文件中,一天更新一次。只须要只须要把sitemap.toXML()
改为fs.writeFileSync("app/assets/sitemap.xml", sitemap.toString());
便可。每次请求sitemap时读文件便可segmentfault