您还没有绑定微信,更多功能请点击绑定

一道回归分析的题目,大家来看看

最近碰到一回归分析的题目,我和公司的几个BB有些看法上的差异,先在这里和大家讨论一下,

“下面是显示广告费用和卖出额的关系,请找出最合适的模型”
广告费用 卖出额
2 5
4 20
6 50
8 70
10 60
12 30

1.首先做图示分析,发现是曲线模型,

2.那么我们选择Regression-->Fitted Line Plot中的二次项分析,得到以下结果。


The regression equation is
C7 = - 51.50 + 27.85 C6 - 1.719 C6**2


S = 10.8480 R-Sq = 88.7% R-Sq(adj) = 81.1%


Analysis of Variance

Source DF SS MS F P
Regression 2 2767.80 1383.90 11.76 0.038
Error 3 353.04 117.68
Total 5 3120.83


Sequential Analysis of Variance

Source DF SS F P
Linear 1 1003.21 1.89 0.241
Quadratic 1 1764.58 14.99 0.030


    []当我做3次分析的时候却发现 :[/]

The regression equation is
C7 = 3.33 - 6.640 C6 + 3.993 C62 - 0.2720 C63


S = 4.80781 R-Sq = 98.5% R-Sq(adj) = 96.3%


Analysis of Variance

Source DF SS MS F P
Regression 3 3074.60 1024.87 44.34 0.022
Error 2 46.23 23.12
Total 5 3120.83


Sequential Analysis of Variance

Source DF SS F P
Linear 1 1003.21 1.89 0.241
Quadratic 1 1764.58 14.99 0.030
Cubic 1 306.81 13.27 0.068


通过对二次模型和三次模型的比较来看,关键性指标"S,R-sq,R-sq adj"都显示三次模型 要好于二次模型,最重要的是我从残差图确认後发现,三次的残差模型要二次的好,所以我选择使用三次模型更好。

但是其他BB的看法是,从ANOVA分析中可以看到
Source DF SS F P
Linear 1 1003.21 1.89 0.241
Quadratic 1 1764.58 14.99 0.030
Cubic 1 306.81 13.27 0.068

二次项很显著,P=0.03〈0.05,但是三次项P=0.068〉0.05 不显著,所以不使用三次模型而使用二次模型。

各位得看法是什么呢?请说明一下!

对“好”的回答一定要点个"赞",回答者需要你的鼓励!
已邀请:
典型的统计陷阱!
就事论事:模型就不对,影响销售的因子除了广告,有月份,市场变化,产品周期等等,单单针对一个因子做回归,显然不理解回归的用法。否则,我还可以得出学历越高,个子越矮,纬度越南,小姐越多的“二次拟和曲线”。

还黑带,白带,看来都走火入魔了,拜托,什么独孤九剑,不如简单的小儿打架。

还“样本不足”, 样本足了我能算出深圳北30公里处的小姐密度。

36 个回复,游客无法查看回复,更多功能请登录注册

发起人

扫一扫微信订阅<6SQ每周精选>