概率图模型1 绪论

2024-09-09

该笔记主要介绍概率图模型最基本的绪论,包括想要解决什么问题,有哪些常见的概率图模型,以及如何建模、推理和学习。

1 Introduction

课程主要是用图模型的方式解决复杂的概率问题(不含coding相关)

Life is full of uncertainy

概率是用于描述不确定性的数学模型

决策的难度源于现实世界的决策空间太大(维数灾难:简单的系统有太多的决策,指数导致参数过多)、系统的元素太多(复杂性问题)

eg. 医生的诊断就是一个复杂问题的决策

当上述的症状数量增加,病因增加之后,决策空间将更加庞大,依赖于医生的经验误判概率将更大,这也是为什么希望通过算法模型来辅助

中医的五行学说的本质就是隐空间有5个隐变量(无法解释为什么是五维的隐空间)

2 Basics in with Probability

频数概率:

\(P(x) \approx \frac{n_x}{n_t}\) \(P(x)=lim\frac{n_x}{n_t}\)

贝叶斯概率:

X是原因 Y是结果(观测),现在需要的是从结果推出原因

故而从:

\[P(XY)=P(X|Y)P(Y)=P(Y|X)P(X)\]

变形后:

\[P(X|Y)=\frac{P(Y|X)P(X)}{P(Y)}\]

而:

\[P(Y)=\Sigma_XP(Y|X)P(X)\]

独立性会降低推理的自由度

如X和Y独立那么:

\[P(XY)=P(X)P(Y)\]

最常用的公式:

链式法则:

全概率公式:

3 Basics in Graph

图论的经典起源是修桥的七桥问题

一般性的有向图用G表示,V表示结点,E表示边:

\[G(V,E)\]

无向图则用H表示(同一条路径双向可达)

临界矩阵:

\[A={a_{ij}}_{n*n}\]

polytree是单个节点可以有多个父节点但不能有三角形或者四边形

chordal graph是图例不能有多于三角形的多边形

4 Probabilistic Graphical Models(PGMs)

PGMs在表述层面的优势:

相较于直接看公式而言看图可以更加明晰的了解事件之间的关系

提供通解框架uniform framework for reasoning

无向图的例如上面的四个白色节点之间的连接是双向可同行

无向图在cv nlp和语音识别上广泛应用,例如马尔可夫随机场被广泛应用于图像分割之中

Three Steps for PGMs

  1. Representation:how to model your problems using probability and graph——即建模
  2. Inference:how to calculate the posterior with some given/observed variables (model is known)
  3. Learning:how to estimate the parameters of the model when you only have observed data