很多时候咱们的判断基于概率,准确来说是后验概率,概率足够高我们倾向于认为正确,反之亦然。所以用相对易于估测的先验概率计算后验概率的贝叶斯公式就极为重要。直接给出:P(A|B)=P(B|A)P(A)/P(B),其中P为概率,易于证明。
贝叶斯公式用处多多,比如在分析孔子后代衍圣公C被Q取代的原因时,我通过概率估算得到了孔子后代被冒充而非绿帽的结果。下面是计算过程:

而我评论区常说的后验概率增量定义没有给出。直接用线性定义没有实际意义。0%~20%~40%…~100%,加着加着就冒了,这种增量和事件本身关系很小。那么如何定义使得事件本身直接决定后验概率增量(广义上也包括减小量)呢?不妨想象,一个与其他事都独立的事件概率为0.6,0.6×0.6=0.36,0.8×0.6=0.48,所以0.6相对于0.36的增量等于0.8相对于0.48的增量。用一个特征量与概率(P)一一对应,设为f(P),则有

一般化,则有

可以观察到,对数函数满足此规律。

下面确定常数n。无论n为多少,当P=1时,恒有f(P)=0,当f(P)单调性相同时不涉及根本性不同,所以n可以任取。简便起见,与e挂钩。取n=e,则f(P)=lnP,f(P)随P的增大而增大,但f(P)≤0,比较恶心;取n=1/e,则f(P)=-lnP,f(P)≥0,但f(P)随P的增大而减小,这违背了用f(P)表征概率的初衷。权衡利弊,取f(P)=lnP。
也就是说,我们取f(P)=lnP,这样可以使得后验概率表征值的增量f(P)与事件直接相关。
根据贝叶斯公式和后验概率表征公式,我们甚至可以在理论上算出一条新信息带来的后验概率增量为lnP(B|A)-lnP(B)。
实际应用中,对于楚王的父系基因这类问题,很多事不能仅仅通过一两点确定。因此有人提出不能用历史特征姓氏做出推断。严格意义上来说不是不能,这种事情改编后验概率,确实有一定的推断作用(多少不一定,还需具体情况具体分析),只是我们不能根据姓氏下定论。
比如我们突然知道自称为屈原后裔的一支家族测出了O-FGC19707,我们令B为这一事件,令A为楚武王19707。把贝叶斯公式变形,得

挨个解释太难打字了,数学量的实际含义和概率估值只能交由大家理解和估算了。
把分子历史学用半定量的方法研究,这将大大提高结论的准确性,具有革命性的意义。
祝融OM188
1 赞