python实现贝叶斯网络的几率推导（Probabilistic Inference）

时间 2019-12-26

标签 python 实现贝叶网络几率推导 probabilistic inference 栏目 Python 繁體版

原文原文链接

写在前面

这是HIT2019人工智能实验三，因为时间紧张，代码没有进行任何优化，实验算法仅供参考。html

实验要求

实现贝叶斯网络的几率推导（Probabilistic Inference）python

具体实验指导书见githubgit

这里首先给出代码github

知识部分

关于贝叶斯网络的学习，我参考的是这篇博客算法

贝叶斯网络（belief network）数组

这篇博客讲述的虽然全面，但细节部分，尤为是贝叶斯网络几率推导的具体实现部分，一笔带过。然而本次实验的要求就是实现贝叶斯网络的几率推导，所以我在学习完这篇博客的基础上，又把老师发的ppt学了一遍，（因为ppt是英文的，一开始我是拒绝学的），最后又挑重点看了下博客和ppt，感受豁然开朗。网络

所以若是没有学习过贝叶斯网络，建议按照我上面列出的顺序学习。app

因为ppt较大，所以这里以网盘形式给出，提取码:cn3h，该ppt仅供我的学习参考，严禁以盈利形式传播函数

关于贝叶斯网络的几率推导，最重要的公式是如下这两个：学习

这两个公式具体什么意思，网上或者是ppt中都有讲解，这里再也不赘述。重点在于这两个公式是完成本实验代码的核心公式，这一点我在完成实验以后才意识到，在以前学习ppt的时候，因为公式众多，并无意识到这两个公式的重要性。

实验代码

代码所在的github地址已给出

须要注意的是，因为该实验指定了数据格式，所以代码彻底是在指定数据格式要求下完成的，不具备普适性，所以实验代码仅供参考算法使用。

设计的cpt格式以下：

class cpt:
    def __init__(self, name, parents, probabilities):
        self.name = name
        self.parents = parents
        self.probabilities = probabilities

贝叶斯网络代码以下

from cpt import cpt

class BN:
    def __init__(self, nums, variables, graph, cpts):
        self.nums = nums
        self.variables = variables
        self.graph = graph
        self.cpts = cpts
        # 建立一个名字与编号的字典，便于查找
        index_list = [i for i in range(self.nums)]
        self.variables_dict = dict(zip(self.variables, index_list))
        # 计算全几率矩阵
        self.TotalProbability = self.calculateTotalProbability()

    def calculateProbability(self, event):
        # 分别计算待求变量个数k1和待消除变量个数k2，剩余的为条件变量个数
        k1 = self.count(event, 2)
        k2 = self.count(event, 3)

        probability = []
        for i in range(2**k1):
            p = 0
            for j in range(2**k2):
                index = self.calculateIndex(self.int2bin_list(i, k1), self.int2bin_list(j, k2), event)
                p = p + self.TotalProbability[index]
            probability.append(p)
        # 最后输出的几率矩阵的格式：先输出true，再输出false
        return list(reversed([x/sum(probability) for x in probability]))

    def calculateTotalProbability(self):
        # 全几率矩阵为一个1 * 2^n大小的矩阵，将列号转化为2进制，可表示事件的发生状况
        # 例如共有5个变量，则第7列的几率为p，表示事件00111（12不发生，345发生）发生的几率为p
        TotalProbability = [0 for i in range(2 ** self.nums)]
        for i in range(2 ** self.nums):
            p = 1
            binary_list = self.int2bin_list(i,self.nums)
            for j in range(self.nums):
                # 分没有父节点和有父节点的状况
                # 注意python float在相乘时会产生不精确的问题，所以每次相乘前先乘1000将其转化成整数相乘，最后再除回来
                if self.cpts[j].parents == []:
                    p = p * (self.cpts[j].probabilities[0][1-binary_list[j]] * 1000)
                else:
                    parents_list = self.cpts[j].parents
                    parents_index_list = [self.variables_dict[k] for k in parents_list]
                    index = self.bin_list2int([binary_list[k] for k in parents_index_list])
                    p = p * (self.cpts[j].probabilities[index][1 - binary_list[j]] * 1000)
            TotalProbability[i] = p / 10 ** (self.nums * 3)
        return TotalProbability

    def int2bin_list(self, a, b):
        # 将列号转化成指定长度的二进制数组
        # 下面两句话的含义：将a转化成二进制字符串，而后分割成字符串数组，再将字符串数组转化成整形数组
        # 若获得的整型数组长度不知足self.nums，则在前面补上相应的零
        binary_list = list(map(int, list(bin(a).replace("0b", ''))))
        binary_list = (b - len(binary_list)) * [0] + binary_list
        return binary_list

    def bin_list2int(self, b):
        # 将二进制的数组转化成整数
        result = 0
        for i in range(len(b)):
            result = result + b[len(b)-1-i] * (2 ** i)
        return result

    def calculateIndex(self, i, j, event):
        # 用于生成下标
        # 原理暂略
        index_list = []
        for k in range(len(event)):
            if event[k] == 2:
                index_list.append(i[0])
                del(i[0])
            elif event[k] == 3:
                index_list.append(j[0])
                del(j[0])
            else:
                index_list.append(event[k])

        return self.bin_list2int(index_list)

    def count(self, list, a):
        # 用于统计一个list中含有多少个指定的数字
        c = 0
        for i in list:
            if i == a:
                c = c + 1
        return c

该实验的主程序（包括读取指定数据文件的函数）以下：

import sys

from BN import BN
from cpt import cpt

# 读取文件并生成一个贝叶斯网络
def readBN(filename):
    f = open(filename, 'r')
    # 读取变量数
    nums = int(f.readline())
    f.readline()
    # 读取变量名称
    variables = f.readline()[:-1].split(' ')
    f.readline()
    # 读取有向图邻接表
    graph = []
    for i in range(nums):
        line = f.readline()[:-1].split(' ')
        graph.append(list(map(int, line)))
    f.readline()
    # 读取cpt表
    # 注意，文件中数据格式必须彻底按照指定要求，不可有多余的空行或空格
    cpts = []
    for i in range(nums):
        probabilities = []
        while True:
            line = f.readline()[:-1].split(' ')
            if line != ['']:
                probabilities.append(list(map(float, line)))
            else:
                break
        CPT = cpt(variables[i], [], probabilities)
        cpts.append(CPT)
    f.close()
    # 根据邻接表为每一个节点生成其父亲节点
    # 注意，这里父亲节点的顺序是按照输入的variables的顺序排列的，不保证更换测试文件时的正确性
    for i in range(nums):
        for j in range(nums):
            if graph[i][j] == 1:
                cpts[j].parents.append(variables[i])

    # 测试父节点生成状况
    # for i in range(nums):
    #     print(cpts[i].parents)
    bayesnet = BN(nums, variables, graph, cpts)
    return bayesnet

# 读取须要求取几率的命令
def readEvents(filename, variables):
    # 条件几率在本程序中的表示：
    # 对变量分类，2表示待求的变量，3表示隐含的须要被消去的变量，0和1表示条件变量的false和true
    # 例如变量为[Burglar, Earthquake, Alarm, John, Mary]
    # 待求的条件几率为P(Burglar | John=true, Mary=false)，则event为[2, 3, 3, 1, 0]
    f = open(filename, 'r')
    events = []
    while True:
        line = f.readline()
        event = []
        if line == "\n":
            continue
        elif not line:
            break
        else:
            for v in variables:
                index = line.find(v)
                if index != -1:
                    if line[index+len(v)] == ' ' or line[index+len(v)] == ',':
                        event.append(2)
                    elif line[index+len(v)] == '=':
                        if line[index+len(v)+1] == 't':
                            event.append(1)
                        else:
                            event.append(0)
                else:
                    event.append(3)
            # 检查文本错误
            if len(event) != len(variables):
                sys.exit()
            events.append(event)
    return events

# 主程序
filename1 = "burglarnetwork.txt"
bayesnet = readBN(filename1)
filename2 = "burglarqueries.txt"
events = readEvents(filename2, bayesnet.variables)
for event in events:
    print(bayesnet.calculateProbability(event))

知识总结

这一部分主要记录在实验过程当中参考的博客，方便以后复习

因为没有系统学过python，其中有挺多都是python基本技巧的，看来之后还要系统学一遍

python中判断readline读到文件末尾
这篇博客参考的是读文件时如何判断读完

python 字符串和整数，浮点型互相转换
这篇博客参考的是如何将从文件读进来的文本转化成数据

python-使用列表建立字典
这篇博客参考的是用list建立字典的方式

python在字符串中查找字符
 在Python中，如何将一个字符串数组转换成整型数组
 Python-八、Python如何将整数转化成二进制字符串
这三篇博客一样是在处理读入数据时参考的

Python3浮点型（float）运算结果不正确处理办法
因为多个浮点数的几率在连乘的时候，致使出现了较大偏差，所以查了这篇博客，不过最后没有使用Decimal模块，而是直接乘1000再除1000解决了。

Python 技巧（三）—— list 删除一个元素的三种作法

python numpy查询数组是否有某个数的总个数
这篇博客，我试了一下发现不能够，报错说不能够对布尔类型求和，恐怕是python版本的问题吧，这个我暂时没有深究，本身写了一个count函数

python list中数字与一个数相乘
对于list中一个数字与一个数相乘的方法，网上广泛给出的另外一种方法是用numpy库，其生成的数组能够直接与数相乘。然而因为我全程没有用到numpy，不想在这个地方单独用个numpy，因此采用了本篇博客中的方法。

python反转列表的三种方式
因为实验指导书指定的输出结果与我算出来的相反，所以翻转了一次列表

实验总结

用一句话总结该实验的做用：使我对于贝叶斯网络的几率推导过程理解的更加透彻

作完实验才意识到若是没有手推几个贝叶斯网络的几率推导，那几乎至关于没有学，要是放到考试绝对写不出来（想起了以前听觉考试，平时没有练习过手推隐马尔科夫，致使考试的时候给了一个很简单的HMM，最后因为太不熟练致使时间不足而没有写完）

整个实验过程比较顺畅，总时间大体8小时左右，其中写代码时间很短，全程几乎没有遇到bug，花时间的地方在于如何设计表示条件几率。这个东西花了我特别长的时间，最后的形式我的感受不是特别简洁，可是放在程序里仍是挺好用的。