包括所有可以出现的表、意义和模型好坏的判断标准
1,在回归模型前设置类型角色分配:1个目标,多个输入无关的数据角色选择“无”;
2,在【字段】中选择使用預定角色;
3在【模型】中按需求选择建模方法;可参考
注:当模型不再将新字段纳入模型,也不再将已有字段移出模型时完成回归模型的建立。建模时纳入F概率<移除F概率,纳入F值>移除F值
4,在【专家】中一般不调整异常值容差,为解释完整在【输出…】中勾选全蔀选项,实际项目中可以按需勾选
其他模块中的内容易懂本文主要解释【高级】中的输出含义。
对所有输入和目标等字段的描述性统计包括Mean(均值),Std.Deviation(标准差)N(建模使用到的记录数)。
表示变量之间的两两相关性在输出——Statistics统计量节点中也可以输出Pearson相关矩阵。
3【 N 】 数据数量
实质上为建模的过程。根据模型设置中建模方法(进入法、步进法、后退法、前进法)的选择不同变量的移入移出(是否参与构建回归模型)过程也不同。其他输出结果也会有差异但模型总体差距不大。
【R?】 R Square值越接近1模型拟合效果越好。
【A~R】Adjusted R Square修正的R?值,考虑了对模型复杂度的 ”惩罚“ 。每有一个新的变量加入构建模型R?会上升,但模型复杂度也同时变高,拟合度评分上升,但复杂度评分下降,因此A~R?可以看成同时考虑了拟合度和复杂度的模型质量评分。
【Selection Criteria】选择标准。信息论中的信息准则其中AIC中有K、L两个变量,k樾小AIC越小,模型简洁度越好;L越大AIC越小,模型精确度越好因此AIC值越小越好。类似的其他值也有相应的公式计算方法可自行搜索了解。
【Durbin-Waston】DW值通常在[0,4]范围内若在2左右,表示输入变量之间的相关性较弱模型效果较好。
自由度df:可以任意取值的变量个数n各估计参数,自由度为n-1
《自由度-F值表》中有df与其对应F值的标准,若F值<标准F值则差异不明显,若F>标准F值则差异度很大。具体可查找F检验和T检验的資料
【Correlations】相关性。除对角线外的值应小于0.7否则模型是需要调整的。
最小值、最大值、均值、标准差、数据量