python相关

时间 2019-11-17

标签 python 相关栏目 Python 繁體版

原文原文链接

【Information Gain 计算 python实现】http://blog.csdn.net/junfeng_feng/article/details/7650117python

数据挖掘模型中的IV和WOE详解：http://blog.csdn.net/kevin7658/article/details/50780391数组

【字典排序】 http://blog.csdn.net/ghostfromheaven/article/details/7675096安全

1、列表app

列表 a=[1,2,3,4,5,6,7]函数

要取出其中第0个元素以及第3个之后的元素：测试

方法1：a.pop(1).pop(1)spa

方法2：新建列表，b=[], b=[a[0]]+a[2:].net

2、itemgetter对列表排序code

from operator import itemgetterorm

[注意】itemgetter后面括号的参数是表明的第几个区域，例如元组是（2，3），则第0个区域的值是2，第1个区域的值是3.

a=[('b',2),('a',1),('c',0)]

1.使用元组的第二个元素进行排序：

b=sorted(a,key=itemgetter(1))

结果：[('c',0),('a',1),('b',2)]

2.是用元组的第1个元素进行排序：

b=sorted(a,key=itemgetter(0))

结果:[('a',1),('b',2),('c',0)]

三、先对元祖的第2个元素排序，再对第1个进行排序：

b=sorted(a,key=itemgetter(1,0))

结果：[('c',0),('a',1),('b',2)]

四、不接收返回值，直接改动原列表

import operator
a=[0,1,1,1,1,0,0]
b=[0.3,0.7,0.8,0.8,0.9,0.4,0.5]

lt=[]
for i ,v in enumerate(b):
tmp=[v,i]
lt.append(tmp)

print lt
lt.sort(key=operator.itemgetter(0))
print lt

3、字典的get方法

Python 字典(Dictionary) get() 函数返回指定键的值，若是值不在字典中返回默认值。

dict.get(key, default=None)

key -- 字典中要查找的键。

default -- 若是指定键的值不存在时，返回该默认值值
例子：

dict = {'Name': 'Zara', 'Age': 27}

a=dic.get('age',0) #result: 27

b=dic.get('sex',0) #result:0

4、删除列表中的空值

a=[1,2,3,'']

way1:a.remove('')

way2: b=[x for x in a if len(x)>0]

5、同时使用2个分隔符对文本进行分隔

import re

f_in = codecs.open('sex','r','utf-8')
for i in f_in.readlines():
line = i.strip().split('\t')
keys =re.split(';|,',line[-1]) #pkg列表是按；分隔
keys.remove('')

f_in.close()

6、按行枚举 python enumerate

enumerate()是python的内置函数
enumerate在字典上是枚举、列举的意思
对于一个可迭代的（iterable）/可遍历的对象（如列表、字符串），enumerate将其组成一个索引序列，利用它能够同时得到索引和值
enumerate多用于在for循环中获得计数

若是对一个列表，既要遍历索引又要遍历元素时，首先能够这样写：
list1 = ["这", "是", "一个", "测试"]
for i in range (len(list1)):
    print i ,list1[i]123123

上述方法有些累赘，利用enumerate()会更加直接和优美：
list1 = ["这", "是", "一个", "测试"]
for index, item in enumerate(list1):
    print index, item
>>>
0 这
1 是
2 一个
3 测试1234567812345678

enumerate还能够接收第二个参数，用于指定索引发始值，如：
list1 = ["这", "是", "一个", "测试"]
for index, item in enumerate(list1, 1):
    print index, item
>>>
1 这
2 是
3 一个
4 测试1234567812345678

补充

若是要统计文件的行数，能够这样写：
count = len(open(filepath, 'r').readlines())11

这种方法简单，可是可能比较慢，当文件比较大时甚至不能工做。

能够利用enumerate()：
count = -1 
for index, line in enumerate(open(filepath,'r'))： 
    count += 1

7、

u = array([[1,2],[3,4]])

m = u.tolist() #转换为list

m.remove(m[0]) #移除m[0]

m = np.array(m) #转换为array

8、python中使用eval() 和 ast.literal_eval()的区别

eval函数在Python中作数据类型的转换仍是颇有用的。它的做用就是把数据还原成它自己或者是可以转化成的数据类型。

那么eval和ast.literal_val()的区别是什么呢？

eval在作计算前并不知道须要转化的内容是否是合法的（安全的）python数据类型。只是在调用函数的时候去计算。若是被计算的内容不是合法的python类型就会抛出异常。

ast.literal则会判断须要计算的内容计算后是否是合法的python类型，若是是则进行运算，不然就不进行运算。

9、chain的使用

import itertools
listone = ['a','b','c']
listtwo = ['11','22','abc']
for item in itertools.chain(listone,listtwo):
print item

输出：a b c 11 22 abc

10、enumerate使用，返回元素和该元素的索引

a=['a','b','c','d']

dict((w, i + 1) for i,w in enumerate(a))

输出：{'a': 1, 'c': 3, 'b': 2, 'd': 4}

11、Python中asarray用法

asarray(a, dtype=None, order=None)
Convert the input to an array.

举例：

1）Convert a list into an array:将列表转换为数组

>>> a = [1,2]
>>> numpy.asarray(a)
array([1, 2])

2）将数据类型转换为float和int

>>> a= [1,2]
>>> numpy.asarray(a,'f')
array([ 1., 2.], dtype=float32)
>>> numpy.asarray(a,'i')
array([1, 2])

3）判断a中数是否大于0，若是大于0，则将该数置为1,

>>> a = [[1,2],[1,0]]
>>> a = numpy.asarray(a) #必须先转换为array，不然出现array(1.0, dtype=float32)
>>> numpy.asarray(a>0,'i') #'i'表示为dtype类型为int
array([[1, 1],
[1, 0]])
>>> numpy.asarray(a>0,'f')
array([[ 1., 1.],
[ 1., 0.]], dtype=float32)