在众多的软件分类中,有几类的软件不是很重要,但也很重要。它们有的是每隔一段时间须要执行一些任务的软件,咱们叫它定时类软件;还有一种软件是采集网页中的数据,咱们叫它采集类软件。数据库
本产品是任务管理器,包括上述2种软件浏览器
同步服务,能够根据配置好的时间间隔执行任务。能够每隔一段时间,也能够在某个时间点执行安全
采集服务,能够采集指定页面的数据,用于大数据分析。可根据网址直接采集,也能够可视化采集(如:淘宝中个人订单,就是须要登陆才能采集)微信
.NET Framework 4.0组件化
双击软件图标,打开登陆页面,验证成功后弹出如图1-1所示大数据
图1-13d
l 定时模块,任务类型包括:间隔时间和时间点调试
l 采集模块,支持可视化采集和非可视化采集日志
l 完善的日志模块帮助问题的定位和解决blog
只要定义好同步项,这些同步项可保存至内存中,也能够存储在数据库中。用于定义有哪些任务须要定时执行
如上图所示
1, 记录同步项的开始和结束时间,定时执行次数,还有配置项,如:间隔时间,时间点等
2, 最下面的日志用于输出同步项的操做结果
是指程序每间隔必定时间,向系统管理员发送邮件。以通知管理员系统运行正常
是采集模块范围,下一部分详细描述
图3-1
如上图所示
1. 本产品已经内置几个采集模板,如:博客园、糗事百科、淘宝网和1688(需登陆后可视化采集)
2. 选中某个采集模板,点击:建立,至关于建立了这个模板的一个实例(可同时建立多个)
3. 再选中某个实例,点击:开始。实现采集数据
如上图所示
点击开始后,实现数据采集
如果可视化采集,点击:开始的时候,会自动弹出可视化采集页面(注:有的须要登陆)
l 取分页数:是指获取有多少分页,以下图所示
l 采集当页:是指只采集当前页数据,以下图所示
l 下一页:是指当前页采集完成后,直接触发:下一页按钮,实现页面翻转
是指登陆的账户和密码,可直接复制。固然,须要提早配置好才行
采集是指采用调试中的方式,实现对全部页面的采集。步骤以下
a. 先获取有多少分页
b. 循环从第1页开始采集
c. 当前页采集成功后,再触发下一页按钮,采集第2页,直至全部页面均采集完成
不管是可视化采集,仍是非可视化采集。均已实现组件化开发。如:采集页面只有一个,不一样的采集模板,只需传入不一样的参数便可实现
问:若360安全卫士开启时,会弹出是否容许此程序运行,如图8-1所示
图8-1
答:选择:一直容许运行(加入白名单)
问:可视化采集页面中的浏览器控件用的是哪一个?
答:可视化采集控件采用的是微信自带的WebBrowser控件,在Win7或Win10系统中,它须要修改注册,来保证使用的IE内核与系统的IE内核保持一致
对本产品感兴趣的,能够加我微信号(xiyang1011或13867408830)私聊
个人博客即将搬运同步至腾讯云+社区,邀请你们一同入驻:https://cloud.tencent.com/developer/support-plan