不确定性推理是建立在非经典逻辑基础上的一种推理,它是对不确定性知识的运用与处理。
严格地说,所谓不确定性推理就是从不确定性的初始证据出发,通过运用不确定性的知识,最终推出具有一定程度的不确定性但却是合理或者近乎合理的结论的思维过程。
产生式规则:
是可信度,要算可信度就需要条件概率,和先验概率,。
它表示的出现概率与不出现概率之比,显然随的加大也加大。
它表示对的支持程度,取值于,由专家给出。
i
这东西为啥表示E(前提)对H(结论)的支持程度呢?
LS越大,表示E越有可能在H为真的情况下发生。比如E定义为丹炉温度高于3000K,H定义为炼出金丹,那么如果炼出金丹这件事大多发生在丹炉温度高于3000K时,就说明丹炉温度高于3000K的前提条件比较能支持炼出金丹这个结果。
它表示对的支持程度,取值范围为,也是由专家凭经验给出。
对于每个变量,其先验概率和是在没获得任何额外信息之前对变量取值的不确定程度。
假设有两个因素会导致堵车:车多和事故。
堵车的概率就是先验概率。在已知发生事故的前提下算堵车的概率,用因求果,求的是条件概率。
如果已经遇到了堵车,想算这次堵车的原因是事故的概率有多少,用果求因,就叫后验概率。
主观Bayes方法中,知识是用产生式规则表示的:
是结论的先验概率,由专家根据经验给出。
称为充分性度量,指出对的支持程度。
称为必要性度量,指出对的支持程度
和的值由领域专家给出,相当于知识的静态强度。
在主观Bayes方法中,证据的不确定性也用概率表示。
对于证据E,由用户根据观测给出,即动态强度。 由于主观给定有所困难,所以实际中可以用可信度代替。例如在PROSPECTOR中取整数:。
对应于
对应于
对应于
给定后,P计算如下:
i
证据并不一定能确定它就一定或一直能支持结论,所以要引入可信度来表示它到底能有多大概率支持。
合取取最小;析取取最大
当组合证据是多个单一证据的合取时,即
整个组合证据的确定性取决于其中最小的一个:
因为短板效应,一旦有一个无法支持结论,整个组合证据就不能支持结论。
当组合证据是多个单一证据的析取时,即
取概率最大的子证据的概率:
因为一旦有一个支持,整体就支持,除了最大概率的那个其他都没意义。
对于运算则:
主观Bayes方法推理的任务就是根据证据的条件概率及、的值,把的先验概率更新为后验概率 。
确定后验概率的方法随着证据肯定存在,肯定不存在,或者不确定而有所不同。
也就是时,来计算。
由Bayes公式:
两式相除:
几率函数
i
我一开始没看出是怎么来的,后来想起有公式:
,用它把中的 都换成 ,之后就好算了。
公式充分性度量的意义:
当 时, 表明由于证据的存在,增强了为真的程度。
当 时, 表明与无关。
当 时, 表明由于证据的存在,减小了为真的程度。
当 时, 表明由于证据的存在,导致为假。
时,证据肯定不存在。要计算:
由 Bayes 公式得:
两式相除:
即
必要性度量的意义:
当 时,,表明由于证据 不存在,增强了 为真的程度。
当 时,,表明 与 无关。
当 时,,表明由于证据 不存在,减小了 为真的程度。
当 时,,表明由于证据 不存在,导致 为假。
注意
由于 和 不可能同时支持 或同时反对 ,所以在一条知识中的 和 不应该出现如下情况:
在实际应用中通常取 。
时,证据不一定存在。
后验概率:
当 时,。
当 时,。
当 时,
当 为其它值时,通过分段线性插值计算 :
在 PROSPECTOR 中,由于 和 遵从如下关系:
i
PROSPECTOR是一种基于贝叶斯方法的专家系统,主要用于地质勘探和资源评估。
在这里边和都是定死的,公式背下来即可。
将 代入上式得:
若有 条知识都支持相同的结论 ,而且每条知识的前提条件所对应的证据 都有相应的观察 与之对应(由很多组合而成),此时只要先对每条知识分别求出 ,然后运用下述公式求出 :
知识的静态强度 及是由领域专家给出,避免了大量的数据统计工作。和比较全面的反映了证据与结论间的因果关系,使推出的结论有较准确的确定性。
主观Bayes方法不仅给出了证据肯定存在、肯定不存在时更新后验概率的方法,还给出了证据不确定时的方法,实现了不确定性的逐级传递。
n它要求领域专家在给出知识时,同时给出先验概率及,这比较困难。
假设我们试图诊断一个病人是否患有某种疾病(例如肺炎),并且我们知道以下因素可能影响诊断结果:
症状():咳嗽(Cough)、发热(Fever)和呼吸急促(Shortness of Breath)
检验结果(T):医学影像检查异常(如胸部X光)
疾病(D):是否患有肺炎
设定每个变量的先验概率。例如,病人是否患肺炎,可以基于流行病学数据得到。
各症状的先验概率,,,也可以根据历史病例统计得出。
此时,, 为肺炎患者表现出咳嗽、发热和呼吸急促的概率。
是肺炎患者在医学影像检查中拿到异常结果的概率。
在收集数据的过程中,医生对病人的症状进行观察,收集到咳嗽、发热和呼吸急促等症状。
观察到这些症状后,医生可以使用贝叶斯定理更新对肺炎的后验概率:
如果进一步进行胸部X光检查,并获得结果,可以再一次使用贝叶斯定理更新对肺炎的诊断:
不确定性在不同变量之间逐级传递。症状的不确定性影响到疾病的诊断,而检查结果又进一步影响到对疾病的确认。
设有如下知识:
已知:
求:
利用结合不确定合成求解
可见,证据需要观测的支持,而结论需要证据支持。
需要先用和求出,再根据求出结果。
要求出,就要先求和。
先算:
根据
得
再使用公式:
因为,
最后合成时要用这个公式:
所以要求出:
对于同理可得:
根据合成规则算:
现在算:
使用公式:
这是直接把当用了。
这个公式推导过程如下:
首先根据贝叶斯公式,
分解:
表示概率修正,反映了在给定和下额外的信息增益。
我不知道更深入的需不需要学,这一块先搁置。
n根据经验对一个事物和现象为真的相信程度称为可信度。
n可信度带有较大的主观性和经验性,其准确性难以把握。但人工智能面向的多是结构不良的复杂问题,难以给出精确的数学模型,先验概率及条件概率的确定又比较困难。所以可信度方法是一种比较实用的方法。
知识用产生式规则表示:
其中是该知识的可信度。称为可信度因子或规则强度,即静态强度。一般。
证据的不确定性用可信度因子表示:
表示证据的强度,即动态强度;表示知识的强度,即静态强度。
i
证据的强度通常是基于当前信息的质量和数量。当新的信息或观测数据出现时,证据的强度可以变化。例如,在医疗诊断中,随着新的症状被观察到,或新的检查结果被获得,关于病人是否患某种疾病的证据强度会发生改变。
知识被视为某种信念或真理的集合,是一种真理。通常是建立在经过验证的经验、理论或逻辑推理之上的。知识一旦被确立,就相对固定,虽然它可能在之后被更新或修正,但在某个特定时间点上,知识的强度是稳定的。
结论的可信度为:
可信度最低为0。
其中是可信度,范围。
是阈值,明确规定了知识运用的条件:只有当时,该知识才能够被应用。的取值范围为 。
证据E的可信度仍为,但其取值范围为:,因为如果在之间,则不会超出。
当时,
表示证据为真的条件下结论为真的可能性。
设有多条规则有相同的结论,即
如果这条规则都满足:,且都被启用,则首先分别对每条知识规则求出;然后求结论的综合可信度。
可采用如下极大值法:
在证据理论中,分别用概率分配函数、信任函数、似然函数和类概率来描述和处理知识的不确定性。
为假设空间(其中元素互斥,任意时刻都只能取其中一个值),设函数,且满足:
内所有样本点的概率函数值之和为1。
的任何一个子集都对应于一个关于的命题,该命题为:的值在中。
则称为上的概率分配函数,称为的基本概率数。
(1) 表示证据对的子集成立的一种可信任度量。
(2) 概率分配函数不是概率。
是所看到的颜色,红,黄,蓝
则 红 的意思是是红色。红,蓝 的意思是是红色或蓝色。
红,蓝 表示对为红色或蓝色的信任程度为0.2,但是不知具体如何分配。
Obviously,红黄蓝红,黄红,蓝蓝,黄红,黄,蓝,因为的取值必须是其中一种,不可能有别的。
定义:命题的信任函数,对所有的 有:
(1) 命题的信任函数的值,是的所有子集的基本概率分配函数值的和,用来表示对的总的信任。
(2) 函数又称为下限函数。
(3) ,
红,黄红黄红,黄定义:似然函数,且
(1) 表示对为真的信任度,则 表示对为假的信任度,所以 表示对非假的信任度,它又称为上限函数。
(2)
i
指的是对的信任程度,与有交集这件事代表事件在某种程度上与相关。既然要得到的总似然性,就要累加所有和有关的。
(3)
(4) : 表示既不信任,也不信任的一种度量。
注意
是可以既不信任,也不信任的。比如一件我闻所未闻的事就不能臆断其有无。
蓝蓝红黄在实际问题中,根据不同的证据,可以得到多个不同的概率分配函数,为此需要对他们进行合成。 设 和 是两个概率分配函数,则其正交和 定义为:
其中 是 的子集,并且:
设 ,且
求正交和 。
首先求 :
然后求 ,为此,分别求出 , , 即可:
同理可求得:,
故有:正交和
在证据理论中,信任函数 和似然函数 分别表示对命题 信任度的下界和上界,因此可以用区间 作为命题 的不确定性度量:
表示 为假 (为真的信任度是0,为假的信任度是)
表示对 无所知(为真的信任度是0,为假的信任度也是)
表示 为真(为真的信任度是1,为假的信任度是)
表示 为真的信任度为 0.25, 为假的信任度为
信任函数和似然函数都是建立在概率分配函数的基础上的。下面给出一种特殊的概率分配函数,并在此基础上建立一个具体的不确定性推理模型。
定义:设 , 为定义在 上的概率分配函数,且满足:
(1)
(2) ,所有单个元素的概率分配函数值之和可以不为1
(3)
(4)对于任意 ,当 或 时,,就是说只有时才可能不为0。
这是一个特殊的概率分配函数,只有单个元素构成的子集及样本空间 的概率分配函数才可能大于 0,其它子集的概率分配均为 0。
命题 的类概率函数定义为:
类概率函数具有下列性质:
(1)
(2)
(3)
根据上述性质可得如下结论:
(1)
(2)
(3)
在证据理论中,不确定性知识用如下产生是规则表示:
其中: 为前提条件,可以是简单条件,也可以是复杂条件。
是结论,用样本空间的子集 表示。 是可信度因子, 用来指出 的可信度, 满足如下条件:
可信度的和不能大于1。
不确定性证据的不确定性用 表示,其取值范围为 。
对于组合证据,采用最小最大法合成。即:
若 ,则
若 ,则
设有知识:
则结论 的确定性可通过下列步骤求出:
(1) 求出概率分配函数:
若两条知识支持同一结论,即
则首先对每一条知识求出概率分配函数 和 ,然后再用公式
对 和 求正交和,从而得到合成的概率分配函数。
(2) 求出 , , :
求 的不确定性 :
不考,略过。