【Python实战】这一次，他经过公众号访问最新的1024资讯信息，干货，有彩蛋

时间 2019-11-24

标签 Python实战这一次经过公众号访问最新资讯信息干货彩蛋栏目 Python 繁體版

原文原文链接

这次实战项目清单：html

WeRoBot框架开发自动回复微信机器人

Tornado开发后台

MongoDB作数据存贮

Scrapyd部署爬虫

Scrapy编写爬虫

把这些都部署在阿里云服务器上

用Python编写
把这些东西混在一块儿，就实现了，经过微信公众号来获取每日新鲜资讯的功能

废话很少说，先上图，看效果！前端

网页丑，请原谅我，我不是专门写前端的，前端知识我会往后补上的。为何选择电脑端访问，由于手机上访问可能仍是有些限制，可是电脑端访问彻底没有问题啊！这效果赞不赞？牛不牛？程序员

这还不赶忙关注一波『皮克啪的铲屎官』？我都干货作到这份上了，你们还不帮我推广分享一下？让更多的人来享受学习的乐趣。数据库

开发思路

既然看到了效果，那么咱们如今就来扯一扯实现这个过程的前因后果。服务器

首先，咱们白日作梦一下，想着我怎么可以经过微信公众号来访问网站啊？

这里给出答案：咱们须要一个微信自动回复的机器人，由于这样，我就不须要天天本身登录网页端，复制黏贴编写材料了，用电脑来代替个人劳动，这样我多轻松。

这里就是WeRoBot的使用场景。

接下来，咱们若是有了自动回复机器人，那么咱们拿什么来看呢？

这里给出答案：咱们须要在远端架设一台服务器，上面须要跑起来一套网站的服务。给咱们提供一个网页，里面有咱们想要的资讯信息。

这就是阿里云服务器（腾讯的也能够）和Tornado的使用场景。

接着，咱们还得研究，我网页上的数据，从哪里来啊？？

这里给我出答案：网页端读取的数据，都应该是从数据库中读的。

这里就是MongoDB的使用场景。

知道数据从哪里读取的了，那么数据是从哪里来的啊？

这里给出答案：数据是来源，咱们能够经过爬虫程序来爬下来。

这里就是Scray的使用场景了。

想到这里基本差很少了，中间在加一些粘合剂，咱们能够经过Scrapyd来把爬虫部署到远端服务器上，再经过一个定时装置来定时执行爬虫程序。这样咱们就会有源源不断的数据更新了。而网页端，咱们只须要展现当天的数据就能够了。这么下来，微信

一切都思路都很完美，就差一个程序员了，对吗？

咱们选择用Python来搞事情，由于这个东西，很适合搞事情。框架

咱们既然把整个逻辑都想好了，那么咱们倒着来撸这件事情。学习

以前的几篇文章：网站

【Python实战】手把手超详细教程教你Scrapy爬达盖尔社区，有彩蛋
 【Python实战】用Scrapy编写“1024网站种子吞噬爬虫”，送福利
 【Python实战】用代码来访问1024网站，送福利
 【Python实战】用Scrapyd把Scrapy爬虫一步一步部署到腾讯云上阿里云

我已经把怎样写爬虫，以及怎样把爬虫部署到服务器上，都讲的很细很细了，并且还有手把手的教程讲解，可谓很是良心了。这里我就略过了。

接下来，咱们用到了MongoDB，这个的安装过程，我在上一篇文章中讲的很清楚了:

【Python实战】在阿里云服务器上安装MongoDB，并实现远程可视化链接

若是有什么不会的，能够给我留言，我会帮你解答的。

那么前面提到的这几个东西，就剩下WeRoBot和Tornado了。这个我准备在下一期文章中详细给你们讲解怎么开发。这里面的坑其实还很多，可是，我已经给你们踩过了。你们跟着个人步骤一步一步来就彻底OK。

总体回顾

远端的服务器上面的爬虫，是Scrapy写的虫子。

经过Tornado的定时执行功能，会每个小时执行一次。

将爬下来的数据存入到MongoDB中。

Tornado的路径对于的GET方法，会从MongoDB中读取数据，并传入到已经写好的html模板中。

WeRoBot则是依靠Tornado部署的，嵌入到了Tornado服务中。经过微信传过来的特定的指令，来作出返回结果并返回给客户端。

上面的内容就介绍这么多吧，但愿你们可以喜欢。独乐乐不如众乐乐。若是你们喜欢铲屎官的文章，但愿你们可以告诉身边更多的朋友，一块儿加入，来体验更多乐趣。

关注『皮克啪的铲屎官』，回复『Daily』，就会找到你心里深处最想要的东西。

这么硬货的公众号，大家还不赶忙关注一波啊？