机器学习-贝叶斯分类笔记(2)

证据因子可视化

证据因子 :等于三个联合概率的和。

p(x)=k=1Kp(Ckx)Joint p(\boldsymbol{x})=\sum_{k=1}^{K} \underbrace{p\left(C_{k} \cap \boldsymbol{x}\right)}_{\text {Joint }}

image-20221106162940535

p(x)=k=1Kp(Ckx)Joint =k=1K[P(Ck)j=1Dp(xjCk)]p(\boldsymbol{x})=\sum_{k=1}^{K} \underbrace{p\left(C_{k} \cap \boldsymbol{x}\right)}_{\text {Joint }}=\sum_{k=1}^{K}\left[\mathrm{P}\left(C_{k}\right) \prod_{j=1}^{D} p\left(x_{j} \mid C_{k}\right)\right]

比如一个三分类的问题,有三个类别。

p(x)=p(C1x)+p(C2x)+p(C3x)=p(xC1)P(C1)+p(xC2)P(C2)+p(xC3)P(C3)\begin{aligned} p(\boldsymbol{x}) &=p\left(C_{1} \cap \boldsymbol{x}\right)+p\left(C_{2} \cap \boldsymbol{x}\right)+p\left(C_{3} \cap \boldsymbol{x}\right) \\ &=p\left(\boldsymbol{x} \mid C_{1}\right) \mathrm{P}\left(C_{1}\right)+p\left(\boldsymbol{x} \mid C_{2}\right) \mathrm{P}\left(C_{2}\right)+p\left(\boldsymbol{x} \mid C_{3}\right) \mathrm{P}\left(C_{3}\right) \end{aligned}

得到三个类别的联合概率(基于KDE核密度估计)

图片来源b站生姜

然后把这三个类别的联合概率的曲面相加,就是证据因子。

图片来源b站生姜

三个联合概率的曲面最后叠加后的证据因子的图像:

image-20221107124305395

三个颜色的点代表了三个不同的类别。

所以再回头看这个公式:

p(Ckx)Posterior =p(xCk)Joint p(x)=p(xCk)Likelihood p(Ck)Priorp(x)Evidence\underbrace{p\left(C_{k} \mid \boldsymbol{x}\right)}_{\text {Posterior }}=\frac{\overbrace{p\left(\boldsymbol{x} \cap C_{k}\right)}^{\text {Joint }}}{p(\boldsymbol{x})}=\frac{\overbrace{p\left(\boldsymbol{x} \mid C_{k}\right)}^{\text {Likelihood }} \overbrace{p\left(C_{k}\right)}^{\text {Prior}}}{\underbrace{p(\boldsymbol{x})}_{\text {Evidence}}}

分子是联合概率,证据因子在分母,与分类无关,起到的是一个归一化的作用(把值调成 (0, 1) 之间)。

这个归一化的时候,分子和分母是相同维度的矩阵,所以做的是一个点除的运算。

后验概率可视化

经过证据因子的归一化作用,后验概率的相加为1。

p(Ckx)Posterior =p(xCk)Joint p(x)\underbrace{p\left(C_{k} \mid \boldsymbol{x}\right)}_{\text {Posterior }}=\frac{\overbrace{p\left(\boldsymbol{x} \cap C_{k}\right)}^{\text {Joint }}}{p(\boldsymbol{x})}

k=1Kp(Ckx)Posterior =1\sum_{k=1}^{K} \underbrace{p\left(C_{k} \mid \boldsymbol{x}\right)}_{\text {Posterior }}=1

对于一个三分类的问题:

p(C1x)+p(C2x)+p(C3x)=1p\left(C_{1} \mid \boldsymbol{x}\right)+p\left(C_{2} \mid \boldsymbol{x}\right)+p\left(C_{3} \mid \boldsymbol{x}\right)=1

所以后验概率又被称为成员值。

后验的曲面(联合概率曲面归一化后的曲面),比较三个曲面的高度,也可以得到决策边界。(归一化了之后,取值范围是0-1)

image-20221107131552634 image-20221107131607477

后验概率的可视化效果比较好,因为相比于联合概率,后验概率在 (0, 1) 之间

可视化

可以看b站生姜的原视频,这个可视化非常好!我这里只是想搬运一下他的图。

b站链接 https://www.bilibili.com/video/BV19y4y1L7LQ

  • 似然概率和联合概率,其中某一个属性的可视化结果(花萼长度特征)
图片来源b站生姜
  • 证据因子(三条线叠加生成的蓝色的线)
图片来源b站生姜
  • 后验概率
image-20221107134023646

大致就可以分成3类。

如果从另一个属性来看,是这样的结果。


  • 似然概率和联合概率
图片来源b站生姜
  • 证据因子
图片来源b站生姜
  • 后验概率
image-20221107134111408

上面这个 p(x2)p(x_2)是证据因子,三个联合概率叠加的结果。


这个直方图效果也很好,可以清除的展示每一个属性值下,成员值(后验概率)的占比情况。

图片来源b站生姜 图片来源b站生姜

把似然,后验,联合概率,证据因子画在一张图上。(C1类的情况)

似然的面积是1,联合的面积是 P(C1)P(C_1)

image-20221107134456648

reference