Upgrade to Pro — share decks privately, control downloads, hide ads and more …

概率与随机

shhhz
October 11, 2022

 概率与随机

生活中充满了概率与随机,分享通过一些故事和例子介绍了秘书问题、蓄水池抽样算法、洗牌算法、猴子排序、遗传算法、卡方检测。

shhhz

October 11, 2022
Tweet

More Decks by shhhz

Other Decks in Technology

Transcript

  1. 秘书问题(Secretary Problem) 取 N = 3 • 若 R =

    0,等同于直接录取第⼀个,P = " & • 若 R = 2,等同于直接录取第三个,P = " & • 若 R = 1 # 1 2 3 录取结果 1 差 中 优 失败 2 差 优 中 成功 3 中 差 优 成功 4 中 优 差 成功 5 优 差 中 失败 6 优 中 差 失败 P = - .
  2. 𝑃 𝑅 = ∑!"#$% & 𝑃(选 𝑛𝑡ℎ 且 n𝑡ℎ 是最好的)

    = ∑!"#$% & 𝑃 𝑛𝑡ℎ 是最好的 𝑃(第 2 好的在前 𝑅 中) = ∑!"#$% & % & # !'% = # & ∑!"#$% & % !'% = R * ∫ # % % ( 𝑑𝑡 秘书问题(Secretary Problem) -xlog(𝑥)
  3. 蓄⽔池抽样算法 k 大小蓄水池 • 当样本数小于 k 时,直接放入蓄水池 • 从 k+1

    开始,第 m 个样本以 ( ) 的概率放入蓄水池,否则丢弃 放入蓄水池时,从蓄水池样本中随机挑取一个替换掉(各 " ( 概率) ) * % ) ) + 4 5 1 2 3
  4. P(保留5th) = & * P(保留4th) = P(保留 4th AND 没有被

    5th 替换) = P(保留 4th) * P(没有被 5th 替换) = & + * P(没有保留 5th OR 保留了 5th 但是没有替换 4th) = & + * (, * + & * ∗ , & ) = & * P(保留3rd) = P(保留 3rd AND 没有被 4th 替换 AND 没有被 5th替换) = 1 * (" + + & + ∗ , & ) ∗ (, * + & * ∗ , & ) = & + * + * = & * = 1 * P(没留 4th OR 留 4th 但没替 3rd) * P(没留 5th OR 留 5th 但没替 3rd) ) * % ) ) + 4 5 1 2 3 P(保留2nd) = P(保留1st) = P(保留3rd) = & *
  5. P(保留ith | i > k) = P(保留 ith AND 没有被

    i+1th ~ nth替换) = ( - * ∏).-/" ! )#" ) = ( - * ( - -/" * -/" -/, * … * !#" ! ) = ( - ∗ - ! = ( ! = ( - * ∏).-/" ! ()#( ) + ( ) ∗ (#" ( ) P(保留ith | i <= k) = P(没有被 i+1th ~ nth替换) = ∏).(/" ! )#" ) = ( (/" * (/" (/, * … * !#" ! = 𝑘 𝑛 = ∏).(/" ! ()#( ) + ( ) ∗ (#" ( ) , - % , i 1 .. k = ( - * (-/"#( -/" + ( -/" ∗ (#" ( ) * (-/,#( -/, + ( -/, ∗ (#" ( ) * … * (!#( ! + ( ! ∗ (#" ( )
  6. 扫地机器⼈罗⽐ • 罗比只能看到上下左右和当前位置的情况。 • 每次清理执行 200 次动作,动作可以是:向上走, 向下走,向左走,向右走,随机一个方向走、 捡罐头、不动。 •

    每一个动作执行完以后都会有一个评分: 如果捡罐头时格子有罐头,那么罐头被捡起,加 10 分; 如果捡罐头的时候格子中没有罐头,扣 1 分; 如果罗比撞到了墙,扣 5 分。 • 什么样的策略能获得更多的分?
  7. 扫地机器⼈罗⽐ • 状态总数 一共有 3 * 3 * 3 *

    3 * 3 = 243 种状态。 • 策略总数 7.*)
  8. 遗传算法 1. 初始化种群:随机生成 200 个个体 2. 计算适应度:对 200 个个体进行评分,评分的规则是让罗比打扫 1000

    次世界,每次打扫世界都是随机生成的, 且每次打扫罗比移动 200 步,最后算出这 1000 次打扫的平均分。 3. 杂交:根据所有个体的得分,随机选取两个个体进行杂交,得分越高的个体越容易被选中。杂交会生成两个子 代,将子代放入新种群。重复这个过程,直到新种群的个数达到 200 个。 4. 突变:子代的一个或多个基因会有一定的概率发生突变,发生突变的基因会随机变为其他的动作,比如从 1 变 为 6。 5. 迭代:重复以上的过程,直到达到 1000 代。
  9. 卡⽅检验(Chi-Square Test) 🎲 1 2 3 4 5 6 实际值

    12 18 16 13 20 21 期望值 16.6 16.6 16.6 16.6 16.6 16.6 V = 4.04