~ (9)
若 ,则 与 都保留,否则剔除 ,此时再分别以 、 为主元对 和 作紧凑变换得 和 。如此往复,直到判别函数无变量被剔除为止。
第二步:利用选入变量建立判别函数;
第三步:对待判样本作判别分析。
逐步分类判别对参与判别的变量进行了严格的筛选,将最强有力的变量进入判别,但它对判别函数没有约束。
3.贝叶斯逐步分类判别
考虑到两种判别方法的各自优势,兼顾总体出现的概率大小和判别效果,将贝叶斯分类判别与逐步分类判别综合运用,既保留了各总体出现的概率大小(先验概率),又有效剔除多余变量,得到最有力的判别式,从而提高精度,是一种有力且有效的判别方法,判别过程如下:
第一步:利用逐步分类判别剔除多余变量;
第二步:对选入变量建立贝叶斯判别函数;
第三步:对待判样本实施判别分析。
4.应用算例
取某地区疑似传染病例的5个指标变量

作为待判样本,历史数据库中常见的3种传染病数据为样本空间的一个划分 若 落入 ,则 , 为已发传染病的3个种类。对待判样本作出的判别,是该地区已发传染病的3个种类中的类别,还是又一种新型传染病。论文发表。历史数据库中常见的3种传染病数据见表1
类别 |
样本号 |
 |
 |
 |
 |
 |

|
1 |
8.11 |
261.01 |
13.23 |
5.46 |
7.36 |
2 |
9.36 |
185.39 |
9.02 |
5.66 |
5.99 |
3 |
9.85 |
249.58 |
15.61 |
6.06 |
6.11 |
4 |
2.55 |
137.13 |
9.21 |
6.11 |
4.25 |
5 |
6.01 |
231.34 |
14.27 |
5.21 |
8.79 |
6 |
9.64 |
231.81 |
13.03 |
4.88 |
8.53 |
7 |
4.11 |
260.25 |
14.72 |
5.36 |
10.02 |
8 |
8.90 |
259.51 |
14.16 |
4.91 |
9.79 |
9 |
7.71 |
273.84 |
16.01 |
5.15 |
8.79 |
10 |
7.51 |
303.59 |
19.14 |
5.70 |
8.53 |
11 |
8.06 |
231.03 |
14.41 |
5.72 |
6.15 |

|
1 |
6.80 |
308.90 |
15.11 |
5.52 |
8.49 |
2 |
8.68 |
259.69 |
14.02 |
4.79 |
7.196 |
3 |
5.67 |
355.54 |
15.13 |
4.97 |
9.43 |
4 |
8.10 |
476.69 |
7.38 |
5.32 |
11.32 |
5 |
3.71 |
316.12 |
17.12 |
6.04 |
8.17 |
6 |
5.37 |
274.57 |
16.75 |
4.98 |
9.67 |
7 |
9.89 |
409.42 |
19.47 |
5.19 |
10.49 |

|
1 |
5.22 |
330.34 |
18.19 |
4.96 |
9.61 |
2 |
4.71 |
331.47 |
21.16 |
4.30 |
13.72 |
3 |
4.71 |
352.50 |
20.79 |
5.07 |
11.0 |
4 |
3.26 |
347.31 |
17.90 |
4.65 |
11.19 |
5 |
8.27 |
189.56 |
12.74 |
5.46 |
6.94 |
按照贝叶斯逐步分类判别的过程,计算如下:
第一步:利用逐步分类判别剔除变量。
根据2中各阶段的计算公式,计算结果 、 是最有力的判别变量,进入判别函数;
第二步:对选入变量 、 建立贝叶斯判别函数。
根据1中各阶段的计算公式,得到判别函数为:



将待判样本代入判别函数,计算后比较结果得 最大,故判断该疑似传染病例属于第三类传染病,应该按此种病例给予治疗。
5.文章总结
由算例的计算过程和结果,可以看出贝叶斯判别和逐步分类判别的结合,确实是可行且有效的,减少了繁杂的计算,提高了判别的效率,是一种行之有效的判别方法。
判别分析方法的优化和判别能力的提高,是判别分析研究的长期课题,数据挖掘和人工智能神经网络的深化研究,给判别分析带来了又一研究热点。
参考文献
[1]彭红毅,蒋春福,朱思铭.基于ICA与Bayes的判别分析模型[J].计算机应用研究,2007,24(8):58-60.
[2]吉国力,陈舒婷,张延坤.逐步回归与判别分析的应用研究[J].厦门理工学院学报,2006,14(2):22-26.
3/3 首页 上一页 1 2 3 |