将分类问题转化成一个通信问题
接收到的信号可以看作一个时间t的函数
x(t)=信号s(t)+噪声n(t)
对于信号 s(t),我们有两种假设:
- H0: s(t)=0(没有信号,只有噪声)
- H1: s(t)=0(有信号)
如果有多个信号参数,那么就是多分类问题
对于分类错误的代价,这里以二元假设检验为例,用 Cji 表示在假设 Hi 为真(真实类别为 i)时,将信号判断为 Hj (判断成 j)的代价。i,j∈{0,1},0→H0,1→H1
| 代价符号 | 真实情况 | 判断结果 | 名称 | 取值 |
|---|
| C00 | H0 | H0 | 正确拒绝 | 0 |
| C10 | H0 | H1 | 误报(假阳性) | 1(正数作为惩罚) |
| C01 | H1 | H0 | 漏报(假阴性) | 1(正数作为惩罚) |
| C11 | H1 | H1 | 正确接受 | 0 |
检验准则的推导#
假设发送的信号为 x0,x1,接收信号 y ,接收空间为 Sy 。那么状态转移概率为 P(y∣x0),P(y∣x1) 分别表明接收方把每个发送信号转移到 Sy 中任意一点的概率
用 阈值 y 把接收空间 Sy 划分成两部分:Sy0 和 Sy1 。如果 y∈Sy0 就判定为 x0,如果 y∈Sy1 就判定为 x1。
关注出现错误error的概率:
α=∫Sy0P(y∣x1)dy,漏报率x1→x0β=∫Sy1P(y∣x0)dy,误报率x0→x1于是可以定义发送一个x0或x1的平均代价C0和C1:
C0C1=(1−β)C00+βC10=(1−α)C11+αC01更进一步,如果知道了发送x0和x1的先验概率 P(x0),P(x1),就可以计算发送一个信号的平均代价:
CM=P(x0)C0+P(x1)C1展开后得到:
CM=P(x0)C0+P(x1)C1=P(x0)[(1−β)C00+βC10]+P(x1)[(1−α)C11+αC01]=基础代价(全部正确)P(x0)C00+P(x1)C11+误报代价β[P(x0)(C10−C00)]+漏报代价α[P(x1)(C01−C11)]这里的 α 和 β 分别表示漏报率和误报率。还可以继续展开
先利用
∫Sy0P(y∣x1)dy+∫Sy1P(y∣x1)dy=1α=1−βCM继续展开为:
CM=P(x0)C00+P(x1)C11+∫Sy1[P(x0)(C10−C00)P(y∣x0)]dy+∫Sy0[P(x1)(C01−C11)P(y∣x1)]dy随便找个空间,统一积分号的下标:
CM=P(x0)C00+P(x1)C11+∫Sy1[P(x0)(C10−C00)P(y∣x0)−P(x1)(C01−C11)P(y∣x1)]dy为了方便,定义
A(y)=P(x0)(C10−C00)P(y∣x0)B(y)=P(x1)(C01−C11)P(y∣x1)A(y) : 观测到y且真实类别为 x0 ,如果错判为 x1 会产生的风险增量,度量了在点 y 误报的代价。
B(y) : 观测到y且真实类别为 x1 ,如果错判为 x0 会产生的风险增量,度量了在点 y 漏报的代价。
所以
CM=P(x0)C00+P(x1)C11+∫Sy1[A(y)−B(y)]dy由于 C00,C11 是正确分类的代价,通常取值为0,所以基础代价为0。剩下的误报代价和漏报代价都是正数。找一个判决阈值 y 就是最小化代价,也就是最小化积分号的部分:
图解如下

Sy1argmin∫Sy1[A(y)−B(y)]dy或Sy0argmin∫Sy0[B(y)−A(y)]dy显然,A=B满足最小化条件,所以判决准则为:
P(y∣x0)P(y∣x1)≷P(x1)(C01−C11)P(x0)(C10−C00)对应的y
y={1,上式取大于号0,上式取小于等于号太长了不好记,定义
-
L(y)=P(y∣x0)P(y∣x1) 为似然比
-
λ=P(x1)(C01−C11)P(x0)(C10−C00) 为检测阈值
基于这个式子,有如下三种判别准则
贝叶斯准则#
则贝叶斯准则:
L(y)≷λ解 y 就是判决阈值
- 贝叶斯准则需要知道损失函数 Cij 和先验概率 P(xi),以及状态转移概率 P(y∣xi),在实际应用中可能很难获得这些信息。
最大后验概率准则#
如果损失函数不知道,可以简单假设错误判决的代价为1,正确判决的代价为0,即 C10=C01=1 和 C00=C11=0,则检测阈值 λ 简化为:
λ=P(x1)P(x0)最大后验概率准则:
p(y∣x0)p(y∣x1)≷P(x1)P(x0)又
p(y∣x0)p(y∣x1)=P(x1)P(x1∣y)P(y)⋅P(y)P(x0∣y)P(x0)所以最大后验概率准则等价于:
p(x0∣y)p(x1∣y)≷1最大似然准则#
损失函数和先验概率都不知道,假设错误判决的代价为1,正确判决的代价为0,即 C10=C01=1 和 C00=C11=0,以及先验概率相等 P(x0)=P(x1),则检测阈值 λ 简化为:
P(y∣x0)P(y∣x1)≷1