前面介绍了一元线性回归的原理和案例,是使用Python来实现的,里面介绍了很多模型好坏判别的参数,具体可以参考《一元线性回归分析Python》。今天使用Excel来实现,因为大部分时间数据是在Excel里面,直接用现成数据做相关分析和回归分析就很方便。
数据还是使用前面Python模拟的数据,广告投入和销售额之间的关系,如果需要数据进行使用,可以直接复制下面连接到浏览器就可以下载数据了↓
https://linss.oss-cn-beijing.aliyuncs.com/Excel/data_20240615.xlsx
因为一元线形回归比较简单,如果不需要看复杂的统计检验参数,只需要看截距和斜率值,有三种方式可以快速实现。
【方式一:图形法】
通过插入散点图,然后在散点图上插入趋势线,通过趋势线的设置,就可以选择显示一元回归方程,里面就有斜率和截距了;还可以直接显示R方,用来判断模型的拟合程度。
然后在简单的美化一下图形,效果就有了↓
【方式二:函数法】
通过两个函数就可以算出两个参数的值。
首先是计算截距项,通过INTERCEPT函数,参数就是对应的两列,公式如下:
=INTERCEPT(C:C,B:B)
结果是20127.75,和上面图形是一样的结果。
然后通过SLOPE函数就可以计算出斜率:
=SLOPE(C:C,B:B)
结果是4.9668,和上面图形也是一样的结果。
最后就可以通过带入两个值,来预测结果了。
【方式三:数据分析工具】
这是最方便的,也是检验参数最多的一种方式。在Excel里面是推荐使用这种方式的。使用方法也很简单,在【数据】-【数据分析】里面,选择回归分析↓
然后根据需求选择X和Y值列,然后选择参数,就可以直接生成结果了,这里我们把所有的参数都选上看一下效果↓
最后的结果有很多,首先是最重要的统计输出结果,如下↓
里面有重要的参数R方、调整的R方、相关系数、标准误差;还有方差分析;重要的参数截距和斜率,以及参数显著性判断的t值和p值。从数据上看,都很显著,模型整体效果较好。
然后还会生成三张图,第一张是实际值与预测值的图,可以直观的看到预测的好坏↓
第二张是残差图↓
第三张是正态概率图↓
正态概率图通常显示为散点图,其中横轴表示残差的实际值,纵轴表示这些残差值的期望正态分布值(通常是通过正态分布表计算得到的百分位数)。
如果残差完全服从正态分布,图中的点应该大致形成一条直线。这意味着数据点沿着一条从左下到右上的直线分布。如果数据点偏离直线,特别是在两端(即最小和最大的残差值),这可能表明残差不服从正态分布。如果数据点形成一个曲线而不是直线,这可能表明存在非线性关系或异常值,需要进一步调查和调整模型。
正态概率图的解读需要一定的主观判断,但通常如果数据点紧密围绕直线分布,可以认为残差近似服从正态分布。如果数据点明显偏离直线,可能需要考虑使用非参数方法或调整模型以改善残差的正态性。
在实际应用中,除了正态概率图,还可以使用其他统计测试(如Shapiro-Wilk测试)来更严格地检验残差的正态性。这些测试可以提供一个p值,帮助你判断残差是否显著地不服从正态分布。
链接是我使用PowerBI整合的历史文章,按类型分类,可以根据需求查询:Microsoft Power BI↓
相关文章:
马桶堵了且粪水满了怎么办01-01
我国水资源的开发利用与保护01-01
地板都是什么材质的,合适最重要!地板选材指南,收藏就是赚到!01-01
电子除垢机设备是智商税吗01-01
每日分享丨西湖十景简介01-01
鸡蛋PK鸭蛋,营养功效差别到底在哪里?01-01
三八妇女节节日祝福,送给所有女性,祝你3.8节快乐01-01
年轻人脸上长老年斑是什么原因?01-01