利用 numpy.random.permutation() 函数,能够返回一个序列的随机排列。将此随机排列做为 take() 函数的参数,经过应用 take() 函数就可实现按此随机排列来调整 Series 对象或 DataFrame 对象各行的顺序。
其示例代码 example1.py 以下:dom
import numpy as np import pandas as pd #建立DataFrame df = pd.DataFrame(np.arange(12).reshape(4,3)) print(df) 0 1 2 0 0 1 2 1 3 4 5 2 6 7 8 3 9 10 11 #建立随机排列 order = np.random.permutation(4) #经过随机排列调整DataFrame各行顺序 newDf = df.take(order) print(newDf) 0 1 2 2 6 7 8 3 9 10 11 0 0 1 2 1 3 4 5
随机抽样是指随机从数据中按照必定的行数或者比例抽取数据。随机抽样的函数以下:函数
numpy.random.randint(start,end,size)spa
函数中的参数说明以下:code
经过 numpy.random.randint() 函数产生随机抽样的数据,经过应用 take() 函数就可实现随机抽取 Series 对象或 DataFrame 对象中的数据。其示例代码 example2.py 以下对象
import numpy as np import pandas as pd #建立DataFrame df = pd.DataFrame(np.arange(12).reshape(4,3)) print(df) 0 1 2 0 0 1 2 1 3 4 5 2 6 7 8 3 9 10 11 #随机抽样 order = np.random.randint(0,len(df),size=3) #经过随机抽样抽取DataFrame中的行 newDf = df.take(order) print(newDf) 0 1 2 0 0 1 2 1 3 4 5 1 3 4 5