一道回归分析的题目,大家来看看
最近碰到一回归分析的题目,我和公司的几个BB有些看法上的差异,先在这里和大家讨论一下,
“下面是显示广告费用和卖出额的关系,请找出最合适的模型”
广告费用 卖出额
2 5
4 20
6 50
8 70
10 60
12 30
1.首先做图示分析,发现是曲线模型,
2.那么我们选择Regression-->Fitted Line Plot中的二次项分析,得到以下结果。
The regression equation is
C7 = - 51.50 + 27.85 C6 - 1.719 C6**2
S = 10.8480 R-Sq = 88.7% R-Sq(adj) = 81.1%
Analysis of Variance
Source DF SS MS F P
Regression 2 2767.80 1383.90 11.76 0.038
Error 3 353.04 117.68
Total 5 3120.83
Sequential Analysis of Variance
Source DF SS F P
Linear 1 1003.21 1.89 0.241
Quadratic 1 1764.58 14.99 0.030
The regression equation is
C7 = 3.33 - 6.640 C6 + 3.993 C62 - 0.2720 C63
S = 4.80781 R-Sq = 98.5% R-Sq(adj) = 96.3%
Analysis of Variance
Source DF SS MS F P
Regression 3 3074.60 1024.87 44.34 0.022
Error 2 46.23 23.12
Total 5 3120.83
Sequential Analysis of Variance
Source DF SS F P
Linear 1 1003.21 1.89 0.241
Quadratic 1 1764.58 14.99 0.030
Cubic 1 306.81 13.27 0.068
通过对二次模型和三次模型的比较来看,关键性指标"S,R-sq,R-sq adj"都显示三次模型 要好于二次模型,最重要的是我从残差图确认後发现,三次的残差模型要二次的好,所以我选择使用三次模型更好。
但是其他BB的看法是,从ANOVA分析中可以看到
Source DF SS F P
Linear 1 1003.21 1.89 0.241
Quadratic 1 1764.58 14.99 0.030
Cubic 1 306.81 13.27 0.068
二次项很显著,P=0.03〈0.05,但是三次项P=0.068〉0.05 不显著,所以不使用三次模型而使用二次模型。
各位得看法是什么呢?请说明一下!
“下面是显示广告费用和卖出额的关系,请找出最合适的模型”
广告费用 卖出额
2 5
4 20
6 50
8 70
10 60
12 30
1.首先做图示分析,发现是曲线模型,
2.那么我们选择Regression-->Fitted Line Plot中的二次项分析,得到以下结果。
The regression equation is
C7 = - 51.50 + 27.85 C6 - 1.719 C6**2
S = 10.8480 R-Sq = 88.7% R-Sq(adj) = 81.1%
Analysis of Variance
Source DF SS MS F P
Regression 2 2767.80 1383.90 11.76 0.038
Error 3 353.04 117.68
Total 5 3120.83
Sequential Analysis of Variance
Source DF SS F P
Linear 1 1003.21 1.89 0.241
Quadratic 1 1764.58 14.99 0.030
- []当我做3次分析的时候却发现 :[/]
The regression equation is
C7 = 3.33 - 6.640 C6 + 3.993 C62 - 0.2720 C63
S = 4.80781 R-Sq = 98.5% R-Sq(adj) = 96.3%
Analysis of Variance
Source DF SS MS F P
Regression 3 3074.60 1024.87 44.34 0.022
Error 2 46.23 23.12
Total 5 3120.83
Sequential Analysis of Variance
Source DF SS F P
Linear 1 1003.21 1.89 0.241
Quadratic 1 1764.58 14.99 0.030
Cubic 1 306.81 13.27 0.068
通过对二次模型和三次模型的比较来看,关键性指标"S,R-sq,R-sq adj"都显示三次模型 要好于二次模型,最重要的是我从残差图确认後发现,三次的残差模型要二次的好,所以我选择使用三次模型更好。
但是其他BB的看法是,从ANOVA分析中可以看到
Source DF SS F P
Linear 1 1003.21 1.89 0.241
Quadratic 1 1764.58 14.99 0.030
Cubic 1 306.81 13.27 0.068
二次项很显著,P=0.03〈0.05,但是三次项P=0.068〉0.05 不显著,所以不使用三次模型而使用二次模型。
各位得看法是什么呢?请说明一下!
没有找到相关结果
已邀请:
36 个回复
standyness (威望:2)
赞同来自: 李桂贤 、sai799 、Abu030 、greatadmiral 、zhangxiangji 、Diolin2014更多 »
就事论事:模型就不对,影响销售的因子除了广告,有月份,市场变化,产品周期等等,单单针对一个因子做回归,显然不理解回归的用法。否则,我还可以得出学历越高,个子越矮,纬度越南,小姐越多的“二次拟和曲线”。
还黑带,白带,看来都走火入魔了,拜托,什么独孤九剑,不如简单的小儿打架。
还“样本不足”, 样本足了我能算出深圳北30公里处的小姐密度。