那些年，我爬过的北科(序)——我和爬虫的缘分

时间 2019-11-06

原文原文链接

不止不觉中，已经大学毕业上了研究生了，其实这一系列教程很早就想开始写，因为一堆事情加上拖到了如今。（原写于2017年9月18号）git

缘起

大概是大二下学期刚开学的时候，我开始接触了Web开发，那个时候跟着网上看视频，学习了HTTP Get与Post请求，了解了网站是怎么个工做的。我当时忽然联想到了平时都在用的课程格子，想着十分有趣，想着能不能用这种技术去作这样一款查课表的东西。github

因而乎，网上寻找资料，了解了登录的原理，以及如何获取到Cookie。当时，我最熟悉的语言是C#，从网上找了个解析HTML的dll，用着自带的HttpWebRequest就开始搞了。那时还不会用chrome，用的HttpWatch，也遇到了不少坑，不过也经过本身的努力把学校的课表搞下来了。mongodb

不过，我发现单纯搞个课表也并无什么卵用，因而我想到了当时正值学校抢课期间，我就作个抢课软件，那还不吊炸天。chrome

因而我用那个只能在IE上跑起来的HttpWatch抓到了JSON的数据，当时也不知道JSON是什么，只知道XML，还网上问了一下这是什么格式的数据，后来就知道这是传说中的JSON，又去恶补了一遍JSON的知识。而后又找了个C#的解析JSON的dll，在个人电脑上把抢课的软件跑起来了，下面就是当时的软件截图。数据库