读完本章,对随机有了更深刻的理解,great!
第18章介绍常见的概率分布,第19章介绍如何使用随机模拟计算概率分布和特定事件的概率(指的是不能直接用18章的概率模型的非通用性事件),第20章介绍了统计学中基本概念——期望值。
所以18章是可以直接使用的常用模型,19章是具体的方法论用来解决更一般化的概率问题。
第17章 思考随机事件
本章读书笔记已经整理,见《统计学的世界》第3部分机会与概率 读书笔记-1 – Zero
第18章 概率模型
本章关键词:概率模型(probability model), 正态分布
概率模型就是数学中的概率分布,一件事情的几种可能性及其对应的概率,概率之和为1。
概率模型:一个随机现象的概率模型可以描述所有可能的结果,以及任意一组结果的概率。我们有时把一组结果叫作一个“事件”(event)。
常见的几种分布,每种分布的概率分布函数、期望值和方差。
- 二点分布(伯努利)
- 二项分布(累积k次的伯努利)
- 均匀分布
- 指数分布
- 正态分布
抽样的概率模型:正态分布
68-95-99.7规则:分别对应平均值一侧一个、两个、三个标准差的范围,波动范围则是平均值两侧2,4,6个标准差范围。 具体见下图
具体计算涉及到归一化为(0,1)的正态分布计算过程。
正态分布是统计推理的关键方法,这也是《统计学的世界》最后一章要展开介绍的核心内容。

第19章 统计模拟
我的总结:上一章的概率模型是一些常用的统计模拟结论,比如二项分布解决从口袋摸球实验,比如正态分布解决多次掷骰子的平均值问题。
对于一些不常见的随机事件,则需要使用“模拟simulation”来具体分析,这也是下面要提到的蒙特卡洛分析方法的用武之地,用软件模拟代替现实操作,从而更快分析问题(不需要实际发生才能观察,可以在软件中观察和计算长期概率和长期平均值(期望值))。
用模拟代替行动,建立随机模型和模拟是一种科学工具!
读完本文的关键问题: 如何用统计模拟(比如蒙特卡洛模拟器)辅助计算某些现实中选择的概率,从而辅助做出更好的决策。
模拟是科学家和工程师用来计算复杂问题概率的方法。
随机模型的建立和模拟是现代科学强有力的工具,并且不需要懂得高深的数学知识就可以掌握。
如果我们知道每个结果的概率,就可以用随机数字来模拟结果
在这一章里,我们学习了如何用模拟的方法估计复杂事件的概率。
本书中的一个例子: 模拟计算连续十次扔硬币,其中有至少三次连续正面朝上或连续反面朝上的概率。
- 建立模型 【统计模拟最主要也是最难的一部分】
- 为结果分配数字(怎样分配随机数给可能的结果!)
- 模拟多次重复
最终使用计算机模拟上千次,该概率是0.826。
很有意思的解题方法!
概率不一定需要理论计算(可能很难直接计算),而直接暴力重复,反而更精确。 (在《算法之美》中提到了类似的平衡,选择最优的算法,还是直接简单粗暴的看似低效率重复?)
如何通过在地板上扔针计算圆周率(《魔鬼数学》中的例子—“布冯的针”),如何通过在在正方形中的圆圈里扔玉米粒计算圆周率?
对于某些长期概率,我们有正态分布或其它类型的概率分布函数,可以直接基于概率分布函数计算不同结果下的概率。
对于一些特殊指定的随机事件,比如掷硬币三次,三次都是正面朝上的概率是多少(让我想起了《魔鬼数学》中分析篮球运动员的手热现象,就是分析三次投中在所有投篮序列中的占比)? 我们可以使用建立概率模型然后进行重复计算,最终计算出该事件的长期概率。
统计模拟是用计算机的方法进行多次重复抽样,从而计算长期概率。
我们可以使用统计模拟来辅助决策,即模拟出长期概率,再判断是否值得选择。
之前记得看过一篇文章(可能是《随机漫步的傻瓜》一书),作者极度推崇蒙特卡洛模拟,使用该模拟方法来辅助个人决策,找到一下系列,后续我准备在“随机性”统计主题阅读中再研究一下该方法。
蒙特·卡罗方法(Monte Carlo method),也称统计模拟方法,是二十世纪四十年代中期由于科学技术的发展和电子计算机的发明,而被提出的一种以概率统计理论为指导的一类非常重要的数值计算方法。是指使用随机数(或更常见的伪随机数)来解决很多计算问题的方法。与它对应的是确定性算法。蒙特·卡罗方法在金融工程学,宏观经济学,计算物理学(如粒子输运计算、量子热力学计算、空气动力学计算)等领域应用广泛。
留下一个问题,思考如何用随机模拟来验证这个概率:
屋子里有23个人,存在两个人同一天生日的概率超过1/2。
第20章 赌场的生意经:期望值
关键词:期望值,大数定律,长期平均值,
期望值:期望值的定义,既关注概率(赌博赢了的概率),又关注结果大小(奖金大小),两者兼顾选择最大的期望值。
期望值的应用:使用期望值的概率选择买哪种彩票,是否买股票,等决策
如何计算平均值: 除了使用期望值计算公式(平均值的加权平均),还可以使用上一章提到的“随机模拟”方法计算期望值。
本章细节内容没有超出我之前学到的期望值知识,见之前写的一个统计总结:概率阅读总结1: 期望值 – Zero,此处不再重复观点。
用概率模型算出来的期望值,真的就是“长期平均值”。这个有名的事实叫作“大数定律”。
大数定律 大数定律是指,如果结果为数值的随机现象独立地重复出现许多次,实际观察到的结果的平均值会趋近于期望值。
用模拟方法计算期望值
我们在现实生活中怎样计算期望值?你已经知道了数学公式,但是要用公式,必须先知道每个结果的概率。如果用这种方法计算期望值太困难,你也可以用模拟方法来算。步骤还是跟以前一样:建立概率模型,用随机数字模拟,并重复许多次。根据大数定律,这些结果的平均数将会接近期望值。
本章要点
了解大数定律和期望值,有助于理解机会游戏,包括州彩票。期望值提供了一个方法,让你可以比较累积赌注大而赢率小的游戏和累积赌注小而赢率大的游戏,孰优孰劣。
概率和期望值是我们描述随机性的语言。随机性其实是某种秩序,它有一种长期规律性,既非毫无章法,也不能事前预知事件的结果。
当有随机性存在时,概率可以回答“长期下来某事件有多频繁地发生”这样的问题,期望值可以回答“长期下来平均数是多少”这样的问题。由于期望值用概率来定义,两个问题的答案因此息息相关。概率模型对所有可能的结果分配概率,任何一个概率模型都必须符合概率规则。
个人概率代表对于某个事件有多大机会发生的个人判断。个人概率要合理,就必须符合概率规则。
如果要计算一个较复杂事件的概率,而且不用数学方法,那么可以用随机数字来模拟许多次。
用“概率是长期比例”这个概念来思考概率问题。
2-18 下班地铁上,继续更新随机模拟
2-19 下班地铁上,读完第19章,对随机和随机模拟有了更深入的理解,很有收获。
2019-2-20 下班路上 读完期望值 done,晚上复制摘抄,发表。