《统计学习方法》学习笔记(第十一章)

条件随机场
给定一组输入随机变量条件下另外一组输出随机变量的条件几率分布模型。web

隐马尔科夫模型—(打破观测独立性)—>最大熵马尔科夫—(克服标注误差问题)—>条件随机场svg

#例题11.1

#这里定义T为转移矩阵,列表明前一个y,(ij)表明由状态i转到状态j的几率,Tx矩阵x对应于时间序列
#这里将书上的转移特征转换为以下以时间轴为区别的三个多维列表,维度为输出的维度
T1=[[0.6,1],[1,0]];T2=[[0,1],[1,0.2]]
#将书上的状态特征一样转换成列表,第一个是为y1的未规范几率,第二个为y2的未规范几率
S0=[1,0.5];S1=[0.8,0.5];S2=[0.8,0.5]
Y=[1,2,2]  #即书上例一须要计算的非规划条件几率的标记序列
Y=array(Y)-1  #这里为了将数与索引相对应即从零开始

#初始归纳为1取对数
P=exp(S0[Y[0]])
#根据索引取矩阵数值 (求和的对数 等于 对数的连乘)
for i in range(1,len(Y)):
    P *= exp((eval('S%d' % i)[Y[i]])+eval('T%d' % i)[Y[i-1]][Y[i]])
print(P)
print(exp(3.2))

#例题11.2
M1=[[‘a01’,‘a02’],[0,0]]
M2=[[‘b11’,‘b12’],[‘b21’,‘b22’]]
M3=[[‘c11’,‘c12’],[‘c21’,‘c22’]]
M4=[[1,0],[1,0]]
Y=[1,1,1]
Y=array(Y)-1
eval(‘M%d’ % 1)[Y[0]][Y[1]]
#for i in range(1,len(Y)):
#p*=eval(‘M%d’ % i)[Y[i-1]][Y[i]]code

#这里根据例11.2的启发整合为一个矩阵
F0=S0;F1=T1+array(S1*len(T1)).reshape(shape(T1));F2=T2+array(S2*len(T2)).reshape(shape(T2))
Y=[1,2,2]  #即书上例一须要计算的非规划条件几率的标记序列
Y=array(Y)-1

P=exp(F0[Y[0]])
Sum=P
for i in range(1,len(Y)):
    PIter=exp((eval('F%d' % i)[Y[i-1]][Y[i]]))
    P *= PIter
    Sum += PIter
print('非规范化几率',P)