注:答案通常在网上都可以找到。
1.对if __name__ == 'main'
的理解陈述
2.python是如何进行内存管理的?
3.请写出一段Python代码实现删除一个list里面的重复元素
4.Python里面如何拷贝一个对象?(赋值,浅拷贝,深拷贝的区别)
5.介绍一下except的用法和做用?
6.Python中__new__与__init__
方法的区别
7.经常使用的网络数据爬取方法
8.遇到过得反爬虫策略以及解决方法
9.urllib 和 urllib2 的区别
10.设计一个基于session登陆验证的爬虫方案
11.列举网络爬虫所用到的网络数据包,解析包
12.熟悉的爬虫框架
13.Python在服务器的部署流程,以及环境隔离
14.Django 和 Flask 的相同点与不一样点,如何进行选择?
15.写一个Python中的单例模式
16.Linux部署服务脚本命令(包括启动和中止的shell脚本)
17.你用过多线程和异步嘛?除此以外你还用过什么方法来提升爬虫效率?
18.POST 与 GET的区别python
if __name__ == 'main'
的理解陈述__name__
是当前模块名,当模块被直接运行时模块名为__main__
,也就是当前的模块,当模块被导入时,模块名就不是__main__
,即代码将不会执行。请写出一段Python代码实现删除一个list里面的重复元素web
# 1.使用set函数 list = [1, 3, 4, 5, 51, 2, 3] set(list) # 2.使用字典函数, >>> a = [1, 2, 4, 2, 4, 5, 6, 5, 7, 8, 9, 0] >>> b = {} >>> b = b.fromkeys(a) >>> c = list(b.keys()) >>> c
list()
;3,copy
模块的copy()
函数}copy
模块的deep.deepcopy()
函数}except
的用法和做用?__new__
与__init__
方法的区别__new__
:它是建立对象时调用,会返回当前对象的一个实例,能够用__new__来实现单例__init__
:它是建立对象后调用,对当前对象的一些实例初始化,无返回值经常使用的网络数据爬取方法ajax
urllib
和 urllib2
的区别urllib
和urllib2
都是接受URL请求的相关模块,可是urllib2
能够接受一个Request
类的实例来设置URL请求的headers
,urllib
仅能够接受URL。urllib
不能够假装你的User-Agent字符串。urllib
提供urlencode()
方法用来GET查询字符串的产生,而urllib2
没有。这是为什么urllib
常和urllib2
一块儿使用的缘由。列举网络爬虫所用到的网络数据包,解析包正则表达式
写一个Python中的单例模式redis
class Singleton(object): _instance = None def __new__(cls, *args, **kw): if not cls._instance: cls._instance = super(Singleton, cls).__new__(cls, *args, **kw) return cls._instance class MyClass(Singleton): a = 1 one = MyClass() two = MyClass() id(one) = id(two) >>> True
你用过多线程和异步嘛?除此以外你还用过什么方法来提升爬虫效率?shell
POST与 GET的区别express
什么是lambda函数?它有什么好处?
lambda 表达式,一般是在须要一个函数,可是又不想费神去命名一个函数的场合下使用,也就是指匿名函数
lambda函数:首要用途是指点短小的回调函数浏览器
lambda [arguments]:expression >>> a=lambdax,y:x+y >>> a(3,11)