达阵联盟-NFL-美式橄榄球中文网

 找回密码
 加入【达阵联盟】

QQ登录

只需一步,快速开始

搜索
楼主: 惊涛拍岸

[乌鸦] 一篇根据乌鸦过去5年数据进行分析的统计学期末论文,或许可以解释Flacco的合同

    [复制链接]
发表于 2013-5-19 02:17 | 显示全部楼层
可能楼主一开始引用的数据就错了。
在NFL比赛中,无论进攻还是防守,所获得的码数或是丢失的码数,只能作为参考,与胜负无直接关系。
举个例子,绿湾包装工2011赛季中,总进攻码数6482码,丢失总码数6585码,丢失码数比进攻开多了103码,但结果是,绿湾15胜1负

仅从数据看来说,只能证明,在乌鸦的进攻中,冲球的重要性略大于传球。

点评

如果仅仅是把几个数据放在这里,不进行计算,那么任何数据都无法直接说明最后的结果。如果把绿湾的数据和胜负之间进行回归,或许有新的结论可以得出。做统计的话,在做出结果之前,任何肉眼的衡量都是靠不住的。 统  详情 回复 发表于 2013-5-19 02:34
回复

使用道具 举报

发表于 2013-5-19 02:20 来自手机 | 显示全部楼层
本帖最后由 sharpzyg 于 2013-5-19 02:27 编辑
惊涛拍岸 发表于 2013-5-19 01:50
统计的方法,看似是定量,其实是定性。因为我们所做的普通统计样本太少,没法对比coefficient,所以无法对 ...


但是因为你的自变量系数有正负之分,所以简单的0,1是不符合实际的,建模的时候要么y值取正负,这样正负因子才符合实际意义,要么以0.5为标准做修正,否则回到实际中,就是进攻的码数对比赛结果的影响大于防守失去的码数,自然会出现进攻重于防守的结果。

最简单的验证方法就是换个样本,比如美洲虎,显然是丢失码数大于取得码数,但是你的模型得出的结论应该还会是进攻码数的权重更高,因为结果始终大于0,丢码数比获得码数更多,所以负值系数会比正值系数小更多,才能保证结果为正。

点评

相同的问题我已经回答过vinff大大一次,永远不要在做出结果之前肉眼观测数据,最小二乘法会常常让各位得出完全出乎意料的结果。绿湾一样,美洲虎也就一样。想知道最终结果,必须先算。 问题依然在于如何理解Dummy V  详情 回复 发表于 2013-5-19 02:57
回复

使用道具 举报

 楼主| 发表于 2013-5-19 02:34 | 显示全部楼层
vinff 发表于 2013-5-19 02:17
可能楼主一开始引用的数据就错了。
在NFL比赛中,无论进攻还是防守,所获得的码数或是丢失的码数,只能作为 ...

如果仅仅是把几个数据放在这里,不进行计算,那么任何数据都无法直接说明最后的结果。如果把绿湾的数据和胜负之间进行回归,或许有新的结论可以得出。做统计的话,在做出结果之前,任何肉眼的衡量都是靠不住的。
统计的意义在于如何将你认为有关的数据之间进行测试,看其相关性。诚然,比赛最终的结果是和很多变量之间有关的,但是要是说输赢和进攻防守的码数无关,那么橄榄球也就不要比了。
按照这个思路,GDP, GINI等指标均可以反映国家的强盛兴衰。但是说这些指标只能作为参考,和国家强盛没有关系,我认为是不妥的。在这里国家的整体实力对GDP等指标还有反作用,而在我的模型里,胜负输赢是对码数完全没有反作用的,因为是由所有队员之前表现所决定的,实在哨响时分决定的,而码数反映的就是队员的表现。
至于绿湾的问题,我也想举个例子,我见过有人统计每个国家首都在纬度线上的位置和国家经济之间的关系,意在说明低纬度国家经济不如高纬度国家发达。做出来的结果是正相关,但是这是一个普遍规律,新加坡的纬度就很低,国家比较发达,难道这一个国家就打破了一般规律吗?没有,这只是个特例。
统计永远不能解释问题,只能验证问题。要想解释这些数据,还需要录像以及技战术分析等很多方法去解释。
数据不分对错,如果不敢大胆设想变量之间的关系,再去用统计的方法来验证,很多学科也是无法前进的。
回复

使用道具 举报

 楼主| 发表于 2013-5-19 02:57 | 显示全部楼层
sharpzyg 发表于 2013-5-19 02:20
但是因为你的自变量系数有正负之分,所以简单的0,1是不符合实际的,建模的时候要么y值取正负,这样正负 ...

相同的问题我已经回答过vinff大大一次,永远不要在做出结果之前肉眼观测数据,最小二乘法会常常让各位得出完全出乎意料的结果。绿湾一样,美洲虎也就一样。想知道最终结果,必须先算。
问题依然在于如何理解Dummy Variable以及统计是做什么用的。而且,我确实没有听说过什么在自变量的平均数上修正自变量的方法。 如果按照您所说的,我们现在做过的很多统计,包括几个经典的模型都已经错了。
为了展示什么叫做和取值无关仅与变量之间的关系相关,我这就用STATA再按照你的方法做一遍。

在第一张图里,赢为1,输为0.第二张图里,赢为1,输为-1.
请看,在两张图里R的平方是一模一样的,P>|t|的值是一模一样的,说明该statistical significant的还是有效,该statistical insignificant的还是无效。唯一变化了的是coefficient,但是coefficient在我上一次回答你中说过了,由于统计样本太小,没有可比性。我们还是可以看到,该是正相关的还是正相关,该是负相关的还是负相关。两张图中的变化如果看的再清楚一点,第二章图的coefficient不过是第一章中的一倍,仅仅说明了自变量从间隔是1,拉到了2.没有别的变化。
再次想说明,dummy variable的设计是统计学中的规范使用方法,统计只看变量之间关系,不看原始因变量取值。我就是把赢变成2,输变成1;或者是赢变成-1,输变成-2,结果都是一样的。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入【达阵联盟】

x
回复

使用道具 举报

发表于 2013-5-19 06:52 | 显示全部楼层
我没有学过统计,大概的看了下过程,感觉单纯分析这四个数据没啥问题……不过个人感觉这个分析还是过于简化了,进攻组和防守组的表现不是一个码数就能概括的。如果觉得统计双方得分会受到特勤组的影响,考虑码数转换得分太过复杂,所以只考虑码数对比赛结果的影响。那至少也应该加入进攻组Fumble数以及随之造成的失码和防守组Force Fumble数以及随之取得的码数这四个变量吧,这还不考虑犯规罚码(如果在算码数时没扣去的话)等等其它对码数有影响的问题。

点评

变量太多的话教授没要求,再说我不是做体育论文,做的是统计论文,核心是看学会了这些统计没有。至于总码数,是已经加入犯规和fumble以及擒杀丢失码数之后的总数。  详情 回复 发表于 2013-5-19 10:30
回复

使用道具 举报

发表于 2013-5-19 08:59 | 显示全部楼层
这种题材也可以做论文,服了

点评

嗯,因为不是体育题材而且不是政治题材,只是个数学论文,因此核心是看会不会用统计方法而已。  详情 回复 发表于 2013-5-19 10:31
回复

使用道具 举报

 楼主| 发表于 2013-5-19 10:30 | 显示全部楼层
mars1028 发表于 2013-5-19 06:52
我没有学过统计,大概的看了下过程,感觉单纯分析这四个数据没啥问题……不过个人感觉这个分析还是过于简化 ...

变量太多的话教授没要求,再说我不是做体育论文,做的是统计论文,核心是看学会了这些统计没有。至于总码数,是已经加入犯规和fumble以及擒杀丢失码数之后的总数。
回复

使用道具 举报

 楼主| 发表于 2013-5-19 10:31 | 显示全部楼层
masterhva 发表于 2013-5-19 08:59
这种题材也可以做论文,服了

嗯,因为不是体育题材而且不是政治题材,只是个数学论文,因此核心是看会不会用统计方法而已。
回复

使用道具 举报

发表于 2013-5-19 11:37 | 显示全部楼层
一直想知道在国内大学用橄榄球做题目写统计学论文有没有可行性?恰巧要期末了
回复

使用道具 举报

 楼主| 发表于 2013-5-19 12:13 | 显示全部楼层
这要问你的老师了,不一定每个老师都好说话。
回复

使用道具 举报

发表于 2013-5-19 16:00 | 显示全部楼层
给力  
必须顶啊
回复

使用道具 举报

发表于 2013-5-19 20:30 | 显示全部楼层
顶,论坛上技术分析太少了,需要你,支持你,加油
回复

使用道具 举报

发表于 2013-5-19 21:15 | 显示全部楼层
高端~!!!

点评

高端还真谈不上,主要是为了完成期末,顺便写个论文,由于要让老师看懂,所以选了最简单的数据而已。  详情 回复 发表于 2013-5-20 09:48
回复

使用道具 举报

发表于 2013-5-19 22:41 | 显示全部楼层
路过看完中文就打酱油了 楼主能发个中文版的么

点评

大神饶了我吧。。。实在是不想翻译了。。。再说翻译了也没什么意思,基本上是数学术语,和橄榄球沾边的没几句话。  详情 回复 发表于 2013-5-20 09:49
回复

使用道具 举报

发表于 2013-5-19 23:09 | 显示全部楼层
兄弟译成中文吧,看来我也得发奋学英语了{:soso_e144:}

点评

翻译了没意思,其实是数学论文,不是写橄榄球的。  详情 回复 发表于 2013-5-20 09:49
回复

使用道具 举报

 楼主| 发表于 2013-5-20 09:48 | 显示全部楼层
Jaymin21 发表于 2013-5-19 21:15
高端~!!!

高端还真谈不上,主要是为了完成期末,顺便写个论文,由于要让老师看懂,所以选了最简单的数据而已。
回复

使用道具 举报

 楼主| 发表于 2013-5-20 09:49 | 显示全部楼层
fcking 发表于 2013-5-19 22:41
路过看完中文就打酱油了 楼主能发个中文版的么

大神饶了我吧。。。实在是不想翻译了。。。再说翻译了也没什么意思,基本上是数学术语,和橄榄球沾边的没几句话。
回复

使用道具 举报

 楼主| 发表于 2013-5-20 09:49 | 显示全部楼层
denniszhtn 发表于 2013-5-19 23:09
兄弟译成中文吧,看来我也得发奋学英语了

翻译了没意思,其实是数学论文,不是写橄榄球的。
回复

使用道具 举报

发表于 2013-5-20 15:37 | 显示全部楼层
最喜欢看数据帝~V5
回复

使用道具 举报

发表于 2013-5-20 16:21 | 显示全部楼层
很多看不懂,但数据分析部分理解了,佩服一个
回复

使用道具 举报

本版积分规则

archiver|手机版|小黑屋|达阵联盟-NFL-美式橄榄球中文网

GMT+8, 2024-11-22 03:45 , Processed in 0.119652 second(s), 14 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表