The groups should be defined before we collect the

This preview shows page 28 - 36 out of 88 pages.

The groups should be defined before we collect the data. The attributes used to separate the groups should discriminate quite clearly between the groups. Hence there is no group overlap or the group overlap is minimal. Group sizes of the dependent should not be extremely different.
Image of page 28

Subscribe to view the full document.

江西财经大学 统计学院 判别分析的假设条件 判别分析最基本的要求是,分组类型在两组以上; 在第一阶段工作是每组案例的规模必须至少在一个 以上。解释变量必须是可测量的,才能够计算其平 均值和方差,使其能合理地应用于统计函数。
Image of page 29
江西财经大学 统计学院 30 判别分析的假设之一,是每一个判别变量(解释变量) 不能是其他判别变量的线性组合。即不存在多重共线性 问题。 判别分析的假设之二,是各组变量的协方差矩阵相等。 判别分析最简单和最常用的形式是采用线性判别函数, 它们是判别变量的简单线性组合。在各组协方差矩阵相 等的假设条件下,可以使用很简单的公式来计算判别函 数和进行显著性检验。 判别分析的假设之三,是各判别变量之间具有多元正态 分布,即每个变量对于所有其他变量的固定值有正态分 布。在这种条件下可以精确计算显著性检验值和分组归 属的概率。当违背该假设时,计算的概率将非常不准确。
Image of page 30

Subscribe to view the full document.

江西财经大学 统计学院 距离判别
Image of page 31
江西财经大学 统计学院 距离判别的思想 最简单的办法就是 : 某点离哪个中心距离最近,就属 于哪一类。 一个常用距离是 Mahalanobis 距离。 用来比较到各个中心距离的数学函数称为判别函数 (discriminant function). 这种根据远近判别的思想,原理简单,直观易懂。 为判别分析的基础
Image of page 32

Subscribe to view the full document.

江西财经大学 统计学院 是从期望 μ = 和协方差阵 Σ = 的总体 G 抽得的两个观测值,则 ) , , , ( 2 1 m x x x x ) , , , ( 2 1 m y y y y ) , , , ( 2 1 m 0 m m ij k i G d i i i , , 2 , 1 ) ( ) ( ) , ( 2 x x x 1 样本 X G i 类之间的马氏距离定义为 X G i 重心间的距离: (一)两个总体距离判别法
Image of page 33