状态表征参数的筛选

(四)状态表征参数的筛选

参数不管是宏观、微观,还是中观,在信息技术中都被认为是变量,参数筛选就是参数优化。状态表征参数的筛选就是选择与判别目标“状态类型”相关的变量,这是一个参数筛选和优化的过程,在数据挖掘技术里,称为数据预处理过程中的特征选择。

1.参数筛选的意义 理论上说,所有与健康状态相关的表征参数都属于健康状态表征参数体系的内容,庞大的参数体系体现了中医整体观念的精髓,也是准确把握状态辨识的前提。然而,如此繁多的参数,单是采集过程本身就十分复杂和耗时,这不符合临床工作实际,也不符合科研的可行性原则。因此,需要借助文献调研、专家经验总结、临床流行病学调查、实验研究、统计学、数据挖掘等现代研究手段和方法对参数进行分析、筛选,筛选出反映整体生命状态如精、气、神的参数和特定健康状态(或功能状态)如脏腑、气血功能状态的参数。筛选出的参数可以包含状态的特征参数、常见参数、否定参数等内容,以便于临床和科研采集与应用。

2.参数筛选的原则与方法 对不同健康状态表征参数进行专家咨询、分析考察或开展必要的临床流行病学预调查试验,根据统计分析的结果再进行参数的筛选。参数集合的筛选应遵循重要性大、敏感性高、独立性强、代表性好和确定性优的原则,并兼顾可操作性及可接受性,具体需要考察参数的困难度、反应特征、辨别力、代表性和独立性等。参数筛选的方法分为无须预调查的参数筛选方法和需预调查的参数筛选方法两大类。无须预调查的参数筛选方法包括主观评价法和德尔菲(Delphi)专家咨询法。需预调查的参数筛选方法包括困难度分析、反应特征分析、离散趋势法、相关系数法、因子分析法、聚类分析法、逐步回归分析法、逐步判别分析等方法。其中,主观评价法就是从重要性角度进行参数筛选;困难度是从可操作性角度筛选参数;反映特征和离散趋势法从敏感度角度筛选参数;相关系数法、因子分析法、聚类分析法、逐步回归和判别法则从独立性和代表性角度筛选参数。这些参数筛选方法,分别从不同的角度和目的对健康状态表征参数进行了筛选。基于整体性、可操作性原则,从宏观、中观、微观构建了“三观并用”的健康状态表征参数体系,最后形成的参数大概有800个左右。