近邻法分类

生物科学2023-02-02 18:32:17百科

近邻法分类

对被识别样本某个给定近邻域中的已知类别的学习样本数量进行统计,并以其中数量最多的那一类作为分类结果的分类方法。对 k个被识别样本的近邻学习样本进行计算时,假设离被识别样本最近的5个学习样本中有3个属于某类,就把被识别样本判别为该类。当k等于1时,就是通常所说的最近邻规则,即被识别样本离哪一类的学习样本最近,就把它分到哪一类(见最小距离分类)。设R1R2…,R0分别是已知类别的c个学习样本集合,每个集合Rj中有uj个特征向量,用x忋表示,k=1,2,…,uj。在用最近邻规则时,可以定义被识别特征向量yRj之间的距离为

式中‖·‖是给定的一种距离度量。分类器把被识别模式分类到d(y, Rj)值最小的那一类中去。当用欧氏距离作为距离度量时,可以证明这种方法实质上是一种分段线性分类器。理论分析表明,当学习样本无限增加时,用最近邻规则分类的结果,其误识率(错分率)不会超过贝叶斯分类器误识率的两倍。

本文标签: 近邻法分类  jinlinfafenlei  

相关推荐

猜你喜欢

大家正在看