回归分析的基本步骤是什么?
的有关信息介绍如下:回归分析:
1、确定变量:明确预测的具体目标,也就确定了因变量。如预测具体目标是下一年度的销售量,那么销售量Y就是因变量。通过市场调查和查阅资料,寻找与预测目标路既法析总的相关影响因素,即自变量,并从中选出主要的360问答影响因素。
2、建立预测模型:肥依据自变量和因变量的历史统计资料进行计算,在此基础上建立回归分析方程,即衡橘回归分析预测模型。
3、进行相关分析:回归分析是对具有因果关系的影响因素颂哪(自变量)和预咐樱团测对象(因变量)所进行的数理统计分析处理。缩静色得标天间展察丰切只有当自变量与因变量确实存在某种关系时,建立的回归方程才有意义。
因此,作银为自变量的因素与作为因以作唱资案称变量的预测对象是否有关,相关程度如何,以及判断这种相关程度的把握性多大据固觉,就成为进行回归分析必须要解决的问题。进行相关分析,一般要求出相关关系,以相关系数的大影电否起独引女小来判断自变量和因变量的相关的程度。
4、计算预测误差:回归预测模型是否可用于实际预测,取决于对回归预测模型的检验和对预测误差的计算。回归方程只有通过各种检验,且预测误差较小,才能将回归方程作为预测模型进行预测。
5、确定预测二值:利用回归预测模型计算预测值,并对预测值进行综合分析,确定最后的预测值。
LogisticRegression逻辑回归
逻辑回归是用来计算“事件=Success”和“事件=Fai零镇lure”的概率。当因变量甚机层般线营合危了律的类型属于二元(1/0,真/假,是/否)变量时,应该使用逻辑回归。这里,Y的值为0或1,它可以用下方程表示。
odds=p/(1-p)=probabilityofeventoccurre此治杀场nce/probabil脱计素反投员站须影ityofnot关eventoccurrence
ln(odds)=ln(p/(1-p))
logit(p)=ln(p/(1-p))=b0+b逐皮政1X1+b2X2+b3X3....+bkXk
在这里使用的是的二项分布(因变量),需要选择一个对于这个分布最佳的连就病能吗杨结函数。它就是Log面即合足德合阶个it函数。在上述方程中,通过观测样本的极大似然估计值来选择参数,而不是最小化平方和误差(如在普通回归使用的)。
以上内容参考:显降错石关北这罪百度百科-回归分析