从零开始学Python网络爬虫第1章

本人本职是第三方实验室环境监测方面的实验员,但业余爱好编程。

Python分为2.x和3.x两个方向,2.x第三方库多,但未来必然是3.x,按着从零开始学Python网络爬虫这本书的介绍,在www.python.org上下载Python运行环境,在pycharm官网(kotlin的编译器官网)下载IDE,安装百度下就应该能了解,主要是下一步,和书里的一样,安装完运行环境后Windows7直接按Windows+r键,输入cmd,然后回车,如下图为成功了。

1.1变量

     我中间的哪行是打印字符a,错误演示

1.2字符串

    字符串用‘’单引号括起来,可以用+号链接,如a=‘ab’,b=‘cd’,a+b=‘abcd’,而a*3=‘ababab’。

   索引和切片:

   a=‘ilove you’

   a[0]=i

   a[0:5]=ilove

但实际上a[0:100]也是可以的,只不过把所有的字符都打印出来了,不会报错,反向也是如此,0:5是从第一个字符到第五个字符

  split(“.”)分割方法

a=‘www.baidu.com’

a.split('.')=['www','baidu','com']

a.replace('baidu','bd')=‘www.bd.com’,替换方法

a.strip() 去除两边空格,如果括号里放入字符则去除两边的字符,但中间的不去除