牙膏的销售量统计回归模型问题某大型牙膏制造企业为了更好地拓展产品市场,有效地管理库存,公司董事会要求销售部门根据市场调查,
找出公司生产的牙膏销售量与销售价格、广告投入等因素之间的关系,从而预测出在不同价格和广告费用下的销售量,下面是 30个销售周期 (4周为 1销售周期 )中收集到的资料,试根据这些数据建立一个数学模型,分析牙膏的销售量与其它因素的关系,为制订价格策略和广告投入提供决策依据,
销售周期 公司的销售价格
(元 )
其它厂家的平均价格 (元 )
广告费用
(百万元 )
价格差
(元 )
销售量
(百万支 )
1 3.85 3.80 5.50 -0.05 7.38
2 3.75 4.00 6.75 0.25 8.51
3 3.70 4.30 7.25 0.60 9.25
4 3.70 3.70 5.50 0 7.50
5 3.60 3.85 7.00 0.25 9.33
6 3.60 3.80 6.50 0.20 8.28
7 3.60 3.75 6.75 0.15 8.75
8 3.80 3.85 5.25 0.05 7.87
9 3.80 3.65 5.25 -0.15 7.10
10 3.85 4.00 6.00 0.15 8.00
销售周期 公司的销售价格
(元 )
其它厂家的平均价格 (元 )
广告费用
(百万元 )
价格差
(元 )
销售量
(百万支 )
11 3.90 4.10 6.50 0.20 7.89
12 3.90 4.00 6.25 0.10 8.15
13 3.70 4.10 7.00 0.40 9.10
14 3.75 4.20 6.90 0.45 8.86
15 3.75 4.10 6.80 0.35 8.90
16 3.80 4.10 6.80 0.30 8.90
17 3.70 4.20 7.10 0.50 9.26
18 3.80 4.30 7.00 0.50 9.00
19 3.70 4.10 6.80 0.40 8.75
20 3.80 3.75 6.50 -0.05 7.95
销售周期 公司的销售价格
(元 )
其它厂家的平均价格 (元 )
广告费用
(百万元 )
价格差
(元 )
销售量
(百万支 )
21 3.80 3.75 6.25 -0.05 7.65
22 3.75 3.65 6.00 -0.10 7.27
23 3.70 3.90 6.50 0.20 8.00
24 3.55 3.65 7.00 0.10 8.50
25 3.60 4.10 6.80 0.50 8.75
26 3.65 4.25 6.80 0.60 9.21
27 3.70 3.65 6.50 -0.05 8.27
28 3.75 3.75 5.75 0 7.67
29 3.80 3.85 5.80 0.05 7.93
30 3.70 4.25 6.80 0.55 9.26
分析与假设由于牙膏是小件生活必需品,对大多数顾客来说,在购买同类产品的牙膏时更多地会在意不同品牌中间的价格差异,而不是他们的价格本身,因此在研究各个因素对销售量的影响时,用价格差代替公司销售价格更为合适,
记牙膏销售量为 y,其它厂家平均价格和公司销售价格之差为 x1,公司投入的广告费用为 x2,其它厂家的平均价格为 x3,公司的销售价格为 x4,x1= x3 - x4.
基本模型先分别作出 y与 x1和 x2的散点图,
x1
y 方法,先在
matlab下分别输入列向量
x1,y.用命令
scatter(x1,y)
即可,然后将生成的图复制出来,
模型为,,110 为随机误差 xy
比较散
x2
y
用线性回归来做,发现不太合适,我们改用二次函数模型,
222210 xxy
22322110 xxxy
2221 3486.06956.33070.13224.17 xxxy
这样,我们得到如下回归模型,
利用 matlab统计工具箱中的 regress求解,可以得到模型为查表,F(3,30-3-1)=F(3,26)=2.98,而统计量 F的值为 82.9,
故我们认为这个模型可用,
但是,由于的置信区间包含零点,因此,我们可以认为回归变量 x2不是太显著,后面我们进一步修改模型,
销售量的预测由前我们得到销售量的预测方程为
2221 3 4 8 6.06 9 5 6.33 0 7 0.13 2 2 4.17? xxxy
这样,只要给定了 x1,x2,我们代入上式就可以进行预测,如
X1=0.2,x2=6时,y=7.9598;
X1=0.1,x2=7时,y=8.796;
注,公司只能控制本公司的牙膏销售价格,而不能控制所有的牙膏销售的平均价格,
回归模型的应用,
只要给定了 x1,x2,我们代入上式就可以进行预测,还可以进行一定的置信度下的区间预测,如当
X1=0.2,x2=6.5时,可以计算得到 95%的预测区间为
[7.8230,8.7638],在公司管理中,这个预测上限可以用来作为公司的生产和库存数量 ;而这个预测下限可以用来较好地把握公司的现金流,因为到时至少有 7.823万支牙膏可以有把握的卖出去,可以回来相应的销售款,
模型的改进凭直觉我们也可以判断出来,x1,x2这两个因素间会有交互作用,我们以二者的乘积来表示这个作用,模型为
21422322110 xxxxxy
利用 matlab可算得预测模型为
212221 4777.16712.0608.71342.111133.29? xxxxxy
较详细的结果见下表,
结果对比,相关系数 (前一个此处为 0.9054)有所提高,
表明现在的模型比前一个模型有所改进,即我们有理由相信,以这个模型来进行预测更符合实际,
参数 参数估计值 置信区间
β0 29.1133 [13.7013,44.5252]
β1 11.1342 [1.9778,20.2906]
β2 -7.6080 [-12.6932,-2.5228]
β3 0.6712 [0.2538,1.0887]
β4 -1.4777 [-2.8518,-0.1037]
R2=0.9209,F=72.7771,p=0.0000
完全二次多项式模型
22521421322110 xxxxxxy
既然出现了二次式子,我们完全可以试试二次完全模型,
利用 matlab我们可以得到这些系数的估计值分别为 32.0984,14.7436,-8.6376,-2.1038,1.1074,
0.7594.
评注建立回归模型往往先根据已知数据,画出散点图,
初步看看二者关系,结合常识和经验进行分析,以决定哪几个是回归变量以及他们的函数形式,往往要用软件求解,统计软件很多,