行,而尚学分享 http://blog.sciencenet.cn/u/dxd 闲话理论生物学

博文

欧洲杯小组赛:从出线结果倒推游戏规则?

已有 8737 次阅读 2012-6-16 06:23 |个人分类:thoughts|系统分类:观点评述| 欧洲杯, Driven, 出线规则, 小组赛, 倒推

本次欧洲杯小组赛出线规则如下:

  小组赛积分相同的球队的排名方式按照以下顺序进行:

  a.球队之间的胜负关系(三球队积分相同时则通过这些球队交战的总积分判定)

  b.球队之间的净胜球数(在两支以上球队处于同分的情况下)

  c.球队之间的总进球数(在两支以上球队处于同分的情况下)

  d.小组赛全部比赛的净胜球数

  e.小组赛全部比赛的总进球数

  f.在欧足联国家排名系统中的积分

  g.在预选赛中公平竞赛排名

  h.抽签决定

  如果两支球队积分,进球数,失球数都相同,并在最后一场小组赛中踢平,如果该小组中再没有另外一支球队与他们积分相同,则两队直接进行点球来决定胜负。

小组赛已经过去两轮,大家根据这些规则来分析各队的出线前景,就已经很头大了。因为有些时候的情况有点复杂。

来点更难的:假设你是个伪球迷,就像我一样,对上面这些规则一无所知。那么等四天之后小组赛的结果全部揭晓之后,你能否从最终的结果来倒推出这些规则?

假设你知道所有这些球队的进球数、输赢关系、红黄牌数、他们的欧足联排名还有在预选赛上的所有成绩。

再多一点条件:你甚至知道赢一场得3分,输一场得0分,平一场得1分。

但是你不知道是不是进球多就有利于出线,你也不知道是不是赢得多就有利于出线。当然这些可以作为你最初的假说,然后用你看到的结果去检验它们。最初的这两个假设还是比较容易检验的。

这样,你能保证把上面那8+1条规则全部倒推出来么?

很明显24场比赛太少了,很可能后面几条规则就没有用到过,那么你是不可能推导出所有规则的。好吧,假设,仅仅是假设,有超过一万场比赛的数据让你用来分析,你能完成这个任务么?

我猜这是一个艰巨的任务。当你不断地在数据中寻找pattern的时候,一会儿你会发现胜负关系似乎决定了每队能否出线,但很快你又否决了这个结论,因为 你发现了很多所谓的“特例”。如此这般,你可能会发现,有时候是净进球数决定了结果,有时候又是总进球数决定了结果。渐渐地你头大了。也许你和很多朋友一 起做这件事情,最后你坚持“抽签决定论”,而你的朋友坚持“红黄牌决定论”,你们开始争论,但谁也无法说服谁。这时另外一个朋友过来说,你们俩都有道理, 但他自己也不确定到底是怎么回事,而你们俩一致认为他在“和稀泥”,是个滑头……

上面这些情况,是否感到有些熟悉?没错,很多学术争论就是这么来的。足球的小组出线规则,不过是8+1条而已,从逻辑上看,一连8个 if...else...,外加一个特例,其实并不是特别复杂。而自然界的规律恐怕比这还要复杂得多。目前基于大规模数据的科研项目到处都是,都进行得热火朝天,然而真要发现一些硬梆梆的规律,那真是难于登天。

我想一个难点在于:这背后的规则多于一条,并且各条规则之间具有一定的逻辑关系,而在“实验”中得到的每一条结果都有可能同时被多条规则所左右。如果研究人员在做数据挖掘的时候,仍然是基于以往的简单逻辑,按照“一条规则一个假说”的惯例来进行推导,那就差不多是瞎子摸象,甚至有时候是缘木求鱼。

有些人于是就说:什么破假说,去他的!我们的现代科学是基于数据的,是“data driven”,那些号称“hypothesis driven”的古典科研方式已经过时了。

我不赞成这种论调。不应该把科研上的失败归罪于“hypothesis driven”。应该检讨的,是我们提出hypothesis的时候所基于的思路而已。其实在两种“driven”之间,哪有什么明显的界限和优劣之分。如此攻击对方,不过就是终于口水仗而已。还是花时间修整一下思路更为重要。

本人在英文博客上也对此发表了一些闲话。内容与本文80%重合。


https://blog.sciencenet.cn/blog-351781-582626.html

上一篇:推荐阅读:关于Human Microbiome
下一篇:High Resolution Melting (HRM) analysis 在谱系地理学中的应用
收藏 IP: 89.204.166.*| 热度|

3 武夷山 陈元印 严明佳

该博文允许注册用户评论 请点击登录 评论 (5 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-26 17:16

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部