欢迎光临
一起学习,一起进步

贝叶斯的进进一步理解

关于之前的硬币并不是均匀分布的理论,如何反证呢?这要提到假设检验的理论:

我们通常在假设某一前提下,得到事件的分布概率,且存在某小概率事件在某区间内发生。最后我们通过实际实验(n次伯努利试验)验证我们的概率。当然我们在验证过程中需要保证一个原则:小概率事件不应在单次试验中发生。最后我们测出了多次试验中小概率事件发生的频率。

实际上对于大数据样本来说,通常用中心极限定理来证明我们所谓的频率趋于概率的理论。

当我们测出的“概率” < 拒绝域( 拒绝原假设的最小显著性水平,p-value,如下例使用单峰检验)时,我们实际上就可认定假设有问题的。

那么在假设验证领域,p-value是什么意思?

我通过翻看知乎,找到了一篇答案:

讲概率、论统计,肯定要从抛硬币说起啊,这才是正确打开姿势嘛。

1 什么是假设检验?

你说你的硬币是公平的,也就是 “花” 和“字”出现的概率是差不多的。

然后,你想和我打赌,作为一个资深的理智赌徒,我怎能听信你的一面之词,我提出要检查下你的硬币到底是不是公平的,万一是两面 “花” 怎么办?电影里面不是经常出现这样的桥段?

你神色紧张,死活不让我检查,后来我们提出了折衷的方案,抛几次硬币,看看结果是不是公平的。

总共扔了两次,都是 “花” 朝上,虽然几率是

,但是也正常,继续扔。

总共扔了四次,也都是 “花” 朝上,几率是

,感觉有点不正常,但是万一是运气呢?继续扔。

总共扔了十次,也都是 “花” 朝上,那我就认为很可能你这枚硬币不是公平的。

这就是假设检验

  • 你提出假设:说你的硬币是公平的
  • 我提出要检验你的假设:扔十次,看实验的结果是不是和你的假设相符

2 P 值

为了完成假设检验,需要先定义一个概念:P 值。我们这里就来解释什么是 P 值?

根据上面的描述,这里假设检验的思路就是:

  • 假设:硬币是公平的
  • 检验:认为假设是成立的,然后扔十次,看结果与假设是否相符

反复扔硬币应该符合二项分布(这就不解释了),也就是:

其中,

代表扔硬币的次数,

代表 “花” 朝上的概率。

在我们认为硬币是公平的前提下,扔 10 次硬币应该符合以下分布:

下图表示的就是,假如硬币是公平的情况下的分布图:

我扔了十次之后得到的结果是,有八次正面:

这个时候有个数学大佬出来定义了一个称为

值(p-value) 的概念:

罗纳德 · 艾尔默 · 费希尔爵士(1890-1962)

把八次正面的概率,与更极端的九次正面、十次正面的概率加起来:

得到的就是(单侧 P 值):

其实,出现两次正面、一次正面、零次正面的概率也是很极端的:

所以(双侧 P 值):

2.1 为什么要把更极端的情况加起来?

根据扔硬币这个例子,可能你会觉得,我知道八次正面出现不正常就行了,干嘛要把九次、十次加起来?

我觉得有这么一个现实原因,比如我要扔 1000 次硬币来测试假设是否正确。

扔 1000 次硬币用二项分布来计算很麻烦,根据中心极限定理,我们知道,可以用正态分布来近似:

比如,我扔了 1000 次,得到了 530 次正面,用正态分布来计算就比较简单。

但是,对于正态分布,我没有办法算单点的概率(连续分布单点概率为 0),我只能取一个区间来算极限,所以就取 530、以及更极端的点组成的区间:

我上面只取了单侧 P 值,说明下:

  • 取单侧还是双侧,取决于你的应用
  • 什么叫做更极端的点,也取决于你的应用

3 显著水平

总共扔 10 次硬币,那么是出现 7 次正面之后,可以认为 “硬币是不公平的”,还是 9 次正面之后我才能确认 “硬币是不公平的”,这是一个较为主观的标准。

我们一般认为

就可以认为假设是不正确的。

0.05 这个标准就是显著水平,当然选择多少作为显著水平也是主观的。

比如,上面的扔硬币的例子,如果取单侧 P 值,那么根据我们的计算,如果扔 10 次出现 9 次正面:

表示出来如下图所示:

我们可以认为刚开始的假设错的很 “显著”,也就是 “硬币是不公平的”。

如果扔 10 次出现出现 8 次正面:

呃,这个和我们的显著水平是一样的啊,我们也可以拒绝假设,只是没有那么 “显著” 了。

4 与置信区间的关系

知识要联系起来看,理解更深刻。

置信区间,目的是根据样本构造一个区间,然后希望这个区间可以把真值包含进去,但是并不知道这个真值是多少?具体可以参考 如何理解 95% 置信区间?

而假设检验,则是假设真值是多少,然后检验这个假设是否可能为真。

之所以觉得它们有关系,大概是因为它们都提到了 0.05。

它们之间的关系也简单,如果我们提出来的假设

在样本

的置信区间内,就可以通过测试:

反之,就不能通过:

赞(0) 打赏
未经允许不得转载:openSL » 贝叶斯的进进一步理解

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏