假设空间H(Hypothesis Set)函数
输入空间D(X1...Xn)大数据
1.增加函数(grown function)io
是关于输入空间尺寸n的函数function
假设空间对于D中全部实例实现分类(赋予标记)的分类方式的最大种数(有多少种分类方式)im
最大值为2^n,可是不少增加函数都达不到最大值。数据
2.对分(dichotomies)img
H对D的一种分类方式就是一种对分di
3.打散(shatter)poi
H能实现D上所有n个实例的所有对分,就是打散,不能实现就是不打散。co
4.Break Point
当n增大到一个值m时,增加函数就不能达到最大值2^n,m就是Break point,也就是第一个不打散的n
5.VC维
假设空间H的VC维是能被H打散的最大的示例集(数据集)的大小,即有: 其中
为假设空间在数据集大小为m时的增加函数。
对于一个假设空间H,若是存在m个数据样本可以被假设空间H中的函数按全部可能的 种形式分开 ,则称假设空间H可以把m个数据样本打散(shatter)。假设空间H的VC维就是能打散的最大数据样本数目m。若对任意数目的数据样本都有函数能将它们shatter,则假设空间H的VC维为无穷大。