一种神秘的估计概率的方法

· · 算法·理论

高考前一天想出来的。

就是发现如果单纯用频率估计概率的话,若一个事件只进行过 1 次并且没有发生,就认为它概率的估计值为 0,就感觉很神秘。因为显然当事件本身的概率不为 0 时,也可能得到同样的结果。要更准确地估计一个事件的概率,应该是取它的概率的期望

继续以那个只进行过一次且没有发生的事件为例,假如这个事件发生的概率为 p,在这个条件下进行一次没有发生的概率应为 1-p,而 p 的取值范围是 [0,1],那么这个事件的概率分布就可以画成一条直线 y=1-p,其中 y 仅表示在假设的概率 p 下,这种情况出现的概率的分布。(即纵轴不代表在实际意义下它出现的概率,实际上对于每个特定的 p_0=p 的概率都是 0,但是能反映它取不同概率值发生情况的比例)。

而它概率的期望就需要从这个神秘的 y=1-p 里面去算。就需要求一个类似加权平均的东西,其中值是 p 轴,权值是 y 轴。

于是就是求 \int_0^x(1-p)(p-x)\,{\rm d}p=\int_x^1(1-p)(x-p)\,{\rm d}p

或者换一种理解方式,就是求 \int_0^1(1-p)(p-x)\,{\rm d}p=0

\int_0^1-p^2+(x+1)p-x\,{\rm d}p=0

这个函数积出来显然是 f(p)=-\dfrac13p^3+\dfrac{x+1}2p^2-xp+C,即

f(1)-f(0)=-\dfrac13+\dfrac{x+1}2-x=0 x=\dfrac13

于是求出来了它真正的,概率的期望是 \dfrac13

然后考虑更复杂的情况,一个事件进行了 n 次,发生了 m 次,求它概率的期望。

对于概率为 p 的情况,这次的分布是 y=C_n^m\times p^m(1-p)^{n-m}

这东西打开是 y=C_n^m\times\sum\limits_{i=0}^{n-m}(-1)^i\times C_{n-m}^i\times p^{m+i}

此时 C_n^m\times\sum\limits_{i=0}^{n-m}(-1)^i\times C_{n-m}^i\times p^{m+i+1}-C_n^m\times x\sum\limits_{i=0}^{n-m}(-1)^i\times C_{n-m}^i\times p^{m+i}

此时 f(p)=C_n^m\times(\sum\limits_{i=0}^{n-m}(-1)^i\times\dfrac{C_{n-m}^i}{m+i+2}\times p^{m+i+2}-x\sum\limits_{i=0}^{n-m}(-1)^i\times\dfrac{C_{n-m}^i}{m+i+1}\times p^{m+i+1}))

f(1)-f(0)=C_n^m\times(\sum\limits_{i=0}^{n-m}(-1)^i\times\dfrac{C_{n-m}^i}{m+i+2}-x\sum\limits_{i=0}^{n-m}(-1)^i\times\dfrac{C_{n-m}^i}{m+i+1}))=0 \sum\limits_{i=0}^{n-m}(-1)^i\times\dfrac{C_{n-m}^i}{m+i+2}=x\sum\limits_{i=0}^{n-m}(-1)^i\times\dfrac{C_{n-m}^i}{m+i+1} x=\dfrac{\sum\limits_{i=0}^{n-m}(-1)^i\times\dfrac{C_{n-m}^i}{m+i+2}}{\sum\limits_{i=0}^{n-m}(-1)^i\times\dfrac{C_{n-m}^i}{m+i+1}}