8.3 线性回归中的虚拟解释变量问题
本节我们讨论在线性回归中自变量(解释变量)为名义级变量和顺序级变量的情形。对于名义级的解释变量,我们分两种情形进行讨论:①解释变量X 是二值名义级变量;②解释变量X 是多值名义级变量。
假设在所讨论的线性回归方程

中,解释变量Xi(i=2,3,…,k)是二值名义级变量(二值无序分类变量)时,那么我们首先需要把它转化为虚拟变量来处理。
定义8.10 所谓虚拟变量D 是指当变量Xi中的一个状态出现时,虚拟变量D 取值为0,而当Xi中的另一个状态出现时,虚拟变量D 取值为1。