把一篇简书博客同步到掘金的 python 脚本

需求

辛辛苦苦写完一篇质量比较高的技术博客,不少开发者朋友都会把它发到简书、掘金、我的博客等数个平台。我也不例外,通常是先在简书写好,由于简书的 markdown 编辑器用起来比较舒服,并且传图片比较方便:只需把要传的图片粘贴到剪切板上,在编辑框里 Command-V 一下,就自动上传图片、并生成相应的 markdown 代码了。javascript

可是往别的平台发的时候有个小问题。第一次,我直接把简书博客全文复制粘贴到掘金的编辑框里,就发出去了;很快就收到掘金编辑的微信:“你的图挂啦!快去看看吧!”原来,简书会自动把博客里的图片重传一次,放在本身的图片服务器 upload-images.jianshu.io 上。而这个服务器对站外访问是有必定限制的,贴到掘金上天然就访问不到了。java

因而,每次在简书发完文章,我都要把全部图片再往我本身的七牛空间从新传一份,而后用七牛的图片连接逐一替换简书的图片连接。这个过程很重复,也很无聊,为何不能用脚本自动化处理一下呢?所以,我写了这个用于同步简书博客的 python 脚本。python


使用

环境准备

这个脚本在 python 2.7.1 下运行经过。图床用的是七牛云存储。
七牛的 python sdk 须要安装 requests,没装的朋友能够在 terminal 里运行 sudo easy_install -U requests 来安装。git

源码地址

源码放在 Github 上,地址戳这里github

用法

  1. 把脚本源码下载到本地
  2. 填写源码中的如下部分:正则表达式

    # 在此处填写你的七牛 Access Key 和 Secret Key
     accessKey = '...'
     secretKey = '...'
     q = Auth(accessKey, secretKey)
    
     # 七牛上的 bucket 名
     bucketName = '...'
     # 这个 bucket 的外链前缀,就是七牛后台的“外链默认域名”
     imageUrlPrefix = "http://xxxxxx.bkt.clouddn.com/"复制代码
  3. 把 blog.txt 里的文本替换成本身的博客内容
  4. 在 terminal 中切换到脚本根目录,运行:python blogbot.py,会看到如下输出:
    $ python blogbot.py 
    正在解析文件...
    正在下载图片...
    下载中:1 / 4
    下载中:2 / 4
    下载中:3 / 4
    下载中:4 / 4
    正在上传图片...
    上传中:1 / 4
    上传中:2 / 4
    上传中:3 / 4
    上传中:4 / 4
    正在写入文件...
    完成啦~复制代码
  5. 新生成的博客就在脚本根目录下的 newBlog.txt 里。拿去用吧:)

源码讲解

为何选择 python?

其实用任何一种脚本语言均可以。七牛还有 javascript 的 sdk,因此一开始想作成一个网页的。不过由于涉及到须要填写七牛的 Access Key 和 Secret Key,感受在本地运行更安全一些(并且懒得画网页了……),因此用的 python。七牛云存储

脚本流程

  1. 读文件
  2. 从博客正文中识别图片连接
    这一步用的是正则表达式,简单匹配 markdown 的图片语法,提取出全部的图片连接。
  3. 下载图片
    用 python 的 urllib.urlretrieve 下载图片,自动命名为 image1image2……
  4. 上传图片到七牛
    使用七牛的 python SDK。自动命名为形如 blog20161027_image1 的文件名,前面拼上七牛的外链前缀,即获得七牛上的外链地址。
  5. 替换连接
  6. 写文件

源码很简单,我注释也写得挺详细的,一看源码就明白了。安全

局限性

主要是为了我本身的需求使用,不少地方考虑得比较简单。好比:服务器

  • 正则表达式只是简单匹配了 markdown 的图片语法,并无考虑例如“图片语法在代码段里“之类的状况。
  • 图片的命名比较简单粗暴,不能知足一天处理两篇文章的需求(第二篇文章的图片会覆盖第一篇)。若是有这种需求,能够简单修改一下命名那部分的代码。

就是这样一个很简单的小脚本,但愿能为你们的生活带来方便~微信

相关文章
相关标签/搜索