如何计算协方差和相关系数,如何计算协方差
对于如何计算协方差和相关系数,如何计算协方差,很多网友还不是很明白,今天艾巴小编收集了这方面的知识,就将其分享出来。
使用标准方差公式:
0:1、将数据组织成一系列(x,y) 值点。您只需要两个变量x 和y 的值范围即可计算方差。如果您在图表上使用数据点,则您的数据应来自图表上的一系列(x,y) 交叉点。或者,您需要在数学上找到两个变量之间的一一对应关系。记下相应的x/y 数据对的数量。这是“n”,即计算方差所需的样本大小。举个例子,假设我们经营一家熟食店,需要确定发放的优惠券是否会对销售产生影响。我们可以定义x为“促销当天发放的优惠券数量”,y为“当天的销量”。为了方便起见,我们以上图的表格作为参考,即第一天我们发放x=1的优惠券,销售y=8,第二天我们发放x=3的优惠券,销售y=6 等
0:2、计算x 的平均值。获得一系列x/y 值后,剩下的工作就不多了。首先计算x的平均值,将所有x值相加并除以样本量(进一步参见我们关于计算平均值的文章)。在我们的例子中,我们需要添加上表“x”列中的值并除以值的数量。计算1+3+2+5.最后得到44。除以9 得到44/9=4.89,这是x 的平均值。见下:1 + 3 + 2 + 5 + 8 + 7 + 12 + 2 + 4=4444/9=4.89
0:3、计算y 的平均值。下一步是计算y 的平均值,其方式与计算x 的平均值相同:将y 值相加并除以样本大小。在我们的例子中,它应该计算8+6+9+4. 得到49。除以样本大小,49/9=5.44 是y 的平均值。见下:8 + 6 + 9 + 4 + 3 + 3 + 2 + 7 + 7=4949/9=5.44
0 :4、将计算值代入公式:1/(n-1)(xx)(y- y)。请注意公式中的西格玛() 符号,这意味着x 的每个值都从平均值中减去并相加(y 也相同)。计算量比较大,需要非常小心,避免出错。在我们的示例中,需要进行以下计算: 1/(n -1)(xx)(y- y)(1/8)(((1 - 4.89)+(3 - 4.89)+(2 - 4.89)+(5 - 4.89)+(8 - 4.89)+(7 - 4.89)+(12 - 4.89)+(2 - 4.89)+(4 - 4.89))((8 - 5.44)+(6 - 5.44 )+(9 - 5.44)+(4 - 5.44)+(3 - 5.44)+(3 - 5.44)+(2 - 5.44)+(7 - 5.44)+(7 - 5.44))(1/8)( (-0.01)((8 - 5.44)+(6 - 5.44)+(9 - 5.44)+(4 - 5.44)+(3 - 5.44)+(3 - 5.44)+(2 - 5.44)+(7 - 5.44)+(7 - 5.44))(1/8)(-0.01)(0.04)=0.00005 正如下面提到的,我们的答案0.00005 非常接近0,这意味着发放优惠券的数量对对熟食店的销售几乎没有影响。
使用协方差值:
0:1、协方差值等于1 表示完全正相关。协方差值始终在1 和-1 之间。超出此范围的值表示计算错误。根据协方差值与1 或-1 的接近程度得出结论。例如,如果协方差值恰好等于1,则两个变量完全正相关。也就是说,一个变量随着另一个变量的增加而增加(减少)。该关系是完全线性的—— 无论变量取多大或多小,两个变量之间的关系都是相同的。举个例子,考虑一下销售柠檬水的简单业务。每杯柠檬水售价3元。如果x 代表售出的柠檬水杯数量,y 代表收入,那么y 将始终随着x 的增加而增加。如下所示: 出售10 杯柠檬水:x=10,y=$30 出售100 杯柠檬水:x=100,y=$300 出售100 万杯柠檬水:x=1,000,000,y=$3,000,000 无论x 的值是多少也就是说,y 将始终等于3(x)。因此,可以说x和y完全正相关,即相关系数等于1。
0:2、协方差值等于-1 表示完全负相关。另一方面,如果协方差值为-1,则两个变量完全负相关。换句话说,一个变量的增加会导致另一个变量的减少,反之亦然。如上所述,这种关系也是线性的。两个变量分离的比率不会随时间变化。举个例子,假设我们正在管理一口总共钻探10,000 桶石油的油井。 x 等于已钻探的桶数,y 等于仍在井中的桶数,因此每当x 增加时,y 就会减少。也就是说,已经钻出的石油是绝对不可能回到井里的。如下所示: 钻探一桶石油:x=1,y=9,999 钻探2000 桶石油:x=2,000,y=8,000。已钻探10,000 桶石油:x=10,000,y=0。每当x 增加时,y 以相同的速率减少。该关系是线性的—— 每钻一桶石油就意味着地下少一桶石油。因此我们说x和y完全负相关,即相关系数为-1。
0:3、协方差为0 意味着没有相关性。如果协方差为0,则表示两个变量不相关。换句话说,我们不会预测一个变量的增加或减少会导致另一变量的增加或减少。两个变量之间不存在线性关系,但非线性关系仍然可以存在。举个例子,假设一个人正在接受治疗病毒性疾病的顺势疗法。如果x 代表药物剂量(以茶匙为单位),y 代表患者血管中的病毒载量(以国际单位每毫升(IU/mL) 为单位),我们无法预测y 会随着x 的增加而增加还是减少。 y的波动完全独立于x。如下所示: 摄入一茶匙:x=1,y=615。摄入10 茶匙:x=10 y=700。摄入20 茶匙:x=20,y=455。随着x 的增加,无法预测是否会增加。 y 将增加或减少。两者之间的关系未知—— 有时服用更多药物会降低病毒载量,但有时会增加病毒载量。因此,我们可以认为x 和y 几乎不相关。
0:4、请注意,-1 和1 之间的值表示不完全相关。大多数协方差值不会严格等于1、-1 或0,通常介于两者之间。根据协方差值与某个基准值的接近程度,可以判断其是正相关还是负相关。例如,协方差值为0.8 意味着高度正相关,但不是完美相关。也就是说,如果x增加,y通常会增加,而x减少,y通常会减少,尽管这种关系并不完全稳定。
特别提示:
阅读有关散点图的文章和有关计算相关系数的文章以获取信息。
协方差方程常用于比较股票—— 投资者想知道两只股票是否会相互波动。要回答这个问题,您只需要一张比较两只股票在一段时间内每日走势的表格,如下所示: br/br/A 公司(x) : (1.6 + 1.9 + 2.1 + 3.2 + 0.5 + 0.4 + 0.6)/7=1.47br/公司B(y): (2.0 + 2.4 + 2.6 + 3.6 + 0.9 + 0.8 + 1.0)/7=1.9br/br/(1/n-1)((x-x ) (y-y)br/br/(1/6)(((1.6 - 1.47)+(1.9 - 1.47)+(2.1 - 1.47)+(3.2 - 1.47)+(0.5 - 1.47)+(0.4 - 1.47) )+(0.6-1.47))((2.0-1.78)+(2.4-1.78)+(2.6-1.78)+(3.6-1.78)+(0.9-1.78)+(0.8-1.78)+(1.0-1.78) )br/br/(1/6)((0.01)(0.84))br/br/(1/6)(0.084)=0.14。
以上知识分享到此为止,希望能够帮助到大家!
推荐阅读
- 魅蓝note6刷机教程,魅族note3刷机教程
- 女生编发技巧,女生的日常编发教程
- 苹果的6s点不见了iphone6s点集在哪里
- 隐形眼镜护理液可以带飞机吗,隐形眼镜护理液能带上飞机吗
- 苹果悬浮窗怎么打开录屏,苹果悬浮窗怎么打开
- 搜狗输入法怎么设置字体大小和字号,搜狗输入法怎么设置字体大小
- 手机网速太慢怎么办,修改一个地方飞快
- 手游我的世界天堂门怎么做,我的世界手机版天堂门怎么做
- 电脑软件打不开双击没反应,双击IE图标无反应,IE浏览器打不开解决办法
- ppt设置单词配读音,PPT为课件中的单词配上读音
- 固态硬盘安装后如何分区,详解固态硬盘分区方法
- 国6排放的车能加92号汽油吗,国6排放标准实施时间什么时候
- 怎么免费注册iPhone,Apple_ID
- 微信在哪里查看自动扣费项目,手机微信自动扣费怎么查看与关闭
- 2021年中级经济师网上报名(2021全国经济师考试报名入口)
- 现在纯碱价格是多少 纯碱网最新价格报价
- 怎么设置qq背景,如何设置手机qq的聊天背景为默认的背景
- 2021醉酒驾车的处罚标准是什么,醉酒驾驶怎么处罚2022年,醉酒驾车的处罚标准是什么
- 夏普空调维修服务(夏普空调维修)
- 笔记本电脑聚合物电池和锂电池哪个好,修复笔记本聚合物电池的方法与技巧