|
概率四则运算的现实意义
葛维亚
1从因果关系角度对自然现象的分类,自然界只存在着确定现象、随机现象和模糊现象三大类。这里仅从工程人员的数学物理角度,而不是单一纯数学角度,对自然现象分类,作量化认识。
现象的因果关系,可以定义如下:
Z=Z(Xi=1-i,PXi=1-i,μA(x)) (1)
式中: Z为表示结果的广义依变量, Xi=1-i为表示原因的第i个广义自变量(i为正整数,且1≤ i <∞),PXi=1-i为X概率,μA(x)为隶属函数。
确定现象
确定现象(即必然现象)可以理解为确定的因果关系。即某些特定原因必定导致某种唯一的后果,原因和结果都是确定的。重复的结果,不存在不确定性。这是事前可预言的现象,即在准确地重复某些条件下,它的结果总是肯定的。例如物理学中力学、运动学、动力学等等现象均属于必然现象。其中的定律、公式定量上准确表达了这些现象。
对于确定现象而言, (1)式中PX i=1-i=1 ,μA(x)=0,Z=函数Y,Xi=1-i=X,因此它们之间关系的表达式为:
Y=f(X) (2)
这种关系为数学上的函数关系,(2)式满足了确定现象数学表达的必要而充分条件。
随机现象
随机现象是原因中至少有一个预知,而又无法搞清全部原因的事前不可预言现象,它的结果总是未知的。即在相同条件下重复进行试验,每次结果未必相同,或知道事物过去的状况,但未来的发展却不能完全肯定,也就是随机现象中是指事件的结果不确定。例如:以同样的方式投掷骰子时,出现1-6点的哪一点,事先并不知道;一个流域未来每年降水量上是多少不知道;一场降雨在流域上产生的径流也不知道。随机现象与确定性现象的共同特点是事物本身的含义确定,区别在于确定性现象的结果具有唯一性,而随机现象当结果具有不确定性。
对于随机现象而言, (1)式中,PXi=1-i=1 ,μA(x)=0,Xi=1-i标识为X,因此它们之间关系的表达式为:
Z=Z (X) (3)
(3)式中这种两变量的关系为相关关系,X与z的相关系数 0≤Φ< 1。很明显,(3) 式也为(1) 式的特例。(3)式满足了随机现象数学表达的必要而充分条件。
在z的不确定性情况下,我们常常以它的数学期望值(数学平均值)x̄ 作为不偏估值在实际应用中使用。在概率分布函数相同时,Z的条件概率P(z/x) i=1-i为定值,而对于正态分布则P(Z/X) i=1-i=0.5。
从形式上看,(3)式与(2) 几乎相同,实际上(3)式表达的是相关关系,而非函数关系。它与函数关系的相同点是自变量是确定的,不同点是得到的依变量是不确定的。在一定概率分布情况下,如果以数学平均值x̄作为标准,其误差在±σ(σ为标准差)区间的概率为68.3%;落入±2σ和±3σ区间的概率分别为95.4%和99.7%。许多行业把|3σ|看作最大误差,在考虑实际情况和不同技术领域要求,以此作为参考,确定规范中的允许误差。
鉴于随机现象是由世界中无限多的影响因素造成的,它的本质是世界的无限性。由于任何实数都可以无穷多分解,成为无穷多个无限小份。用数学式表示为:
任何实数=无穷大×无穷小,
即
a= ? ×δ (4)
如果将a限定为事件的概率P,即
P= ? ×δ (5)
也就是说, P的取值在无穷因素的作用下,任意获得,只是取得机会并不完全一样。这说明无限性,产生随机性。理解该结论时,可以把无穷大看做外部因素,无穷小看做内部因素。因为世界无穷大,所以任何一个存在都受到无穷可能的外因。而任何一存在可以无穷分解,所以也有无穷内因。
如果把概率P定义为P=P(x≥xi),这就是水文水资源分析计算中经常使用的概率,水文界称为频率。则设计频率Pp= P(x≥xp),此处xp为设计值,Pp为设计频率,1/Pp 为重现期。水文水利规划设计的一项重要使命,就是根据有关规范确定的水利工程设计标准Pp或校核标准Pc,推求有关的设计值xp、xc。
描述与表达随机现象的数学工具,我们一般比较陌生,主要数学工具为概率论、数理统计、条件分布、随机过程。概率论与统计学将数学等应用从必然现象扩展到随机现象。水文业界属于概率论、数理统计使用较多的部门,对它们也比较熟悉。例如在水利水电防洪、发电、除涝、灌溉、航运,城市排水、水质评价和水资源评价中,设计标准的确定和设计值计算推求,均与概率论、数理统计有关。这种利用实验或实测获取的一组数据,例如同一河流断面每年的一次最大年降水量,或每年洪峰流量,被看作是总体序列中被随机抽取的一个容量为n的样本。
水文水资源频率计算中,P与线型及其相应的统计参数有关。在线型已经确定情况下,表达为P= f(γ1,γ2,γ3,………,γi),i=1-n,
γi为i阶矩。水文现象为随机现象,其随机变量分布曲线的线型也是未知的。凭借实测资料(即样本资料)得知,水文要素的频率分布不是高斯正态分布(或物理上的白噪音分布),而是偏态分布。长期以来凭借职场专业人员的经验、通过试验模拟、统计检验等论证,主流线型接近不完全Γ分布(这是一组曲线族),p-Ⅲ型就是这个大家庭的一员。确定这一曲线的的统计参数取为三个,即一阶矩数学期望值(平均值)x̄,二阶矩变差系数cv 与三阶矩偏态系数 cs。
根据大数定律,样本容量n越大,即用于计算的资料年限越长或次数越多,随机误差越小,计算得出的不偏估值越接近总体真值。从矩法解析中得知,矩的阶数越高,随机误差越大。归纳起来水文统计中参数的随机误差与样本容量、矩阶数、代表概率分布曲线估值的频率曲线线性型等三个因素有关。目前许多教科书和文章里,把Γ分布和皮尔逊Ⅲ型分布曲线,作为两种独立的线型加以介绍,这是一种误解。因为皮尔逊Ⅲ型分布曲线就是不完全Γ函数的一个特例而已,它是Γ分布曲线族当中的一个。此外,在水文资料短缺流域,也经常通过相关分析与计算,建立各种水文要素之间的经验公式、等值线图、综合单位线以及水文单值化处理计算中落差系数和指数的推求,也会经常使用渐消记忆的最小二乘法、线性逐步回归、最优化方法(确定合理的目标函数、优选范围和精度要求是关键)等数学工具。这一切都要求数学和人的经验相互配合。
P(AB)=P(A)P(B). 如果A、B是条件概率,则:
模糊现象
模糊现象属于事物本身的含义不确定的现象。它与随机现象的共同特点是不确定性,而模糊现象是指事物本身的定义不确定。模糊数学则将数学的应用范围从清晰确定扩大到模糊现象的领域。
日常生活里,受传统思维的影响,把“模糊”看作是糊涂、肤浅、无能的代名词。模糊论创始人,美国L.A.扎德教授曾经有句名言:“模糊不是罪过”。模糊论的出现是数学领域一次革命,使数学的应用跨入一个更高,更新,更有作为的领域。
在多变量、非线性、时变的大系统中,复杂性与精确性形成了尖锐的矛盾。复杂性意味着因素众多,时变性大,其中的某些因素及其变化是人们难以精确掌握的,而且人们又常常不可能对全部因素和过程都进行精确的考察,而只能抓住其中主要部分,忽略掉次要部分。这样,在事实上就给对系统的描述带来了模糊性。模糊数学用精确的数学语言去描述模糊性现象,它代表了一种与基于概率论方法处理不确定性和不精确性的传统不同的思想,不同于传统的新的方法论。
模糊计算可以分四个部分:模糊规则库,模糊化,推理方法和去模糊化。模糊规则库是专家提供的一些规则。模糊化是根据隶属度函数从具体的输入,得到对模糊集隶属度的过程。推理方法是从模糊规则和输入,对相关模糊集的隶属度得到模糊结论的方法。去模糊化就是将模糊结论转化为具体的、精确的输出过程。以此得到模糊计算的结果。模糊计算的流程为:开始→输入变量→将输入变量模糊化→利用相关模糊规则获得结论→将结论去模糊化→输出明确的结果→结束。
4 概率的除法法则
在科技流域内,概率的应用极为重要和普遍,而在我们的生活里它应用也随处可见。
以我国癌症为例,目前平均肺癌死亡率可能是每10万人40人,每年肺癌死亡率为4%,每年39 万人死于肝癌,每年肝癌癌死亡率为2%,如果肺癌和肝癌由于不同的原因却引起,为独立事件,则应该利用概率加法公式,同时患肺癌和肝癌的概率=4%+2%=6%,如果肺癌和肝癌由于同一的原因却引起,则应该利用条件概率加法公式,同时患肺癌和肝癌的概率=p(A)+P(B)-P(AB)= 4%+2%-6=0, 如果以P(A|C)表示吸烟患肺癌的概率,P(C|A)表示患肺癌的人中吸烟的概率. 就可以计算褚条件概率的肺癌死亡率。概率天气预报是用概率值表示预报量出现可能性的大小,它所提供的不是某种天气现象的\"有\"或\"无\",某种气象要素值的\"大\"或\"小\",而是天气现象出现的可能性有多大。如对降水的预报,传统的天气预报一般预报有雨或无雨,而概率预报则给出可能出现降水的百分数,百分数越大,出现降水的可能性越大。一般来讲,概率值小于或等于30%,可认为基本不会降水;概率值在30%-60%,降水可能发生,但可能性较小;概率在60%-70%,降水可能性很大;概率值大于70%,有降水发生。概率天气预报既反映了天气变化确定性的一面,又反映了天气变化的不确定性和不确定程度。在许多情况下,这种预报形式更能适应经济活动和军事活动中决策的需要。日常生活中出现一些危险是难免的,问题是遭遇某种危险的概率有多大。一般说来,如果遭遇某种危险的概率低于十万分之一,我们还能坦然视之;但如果危险概率提高到万分之一,我们就得小心了。每年都可能遇到的危险机会有:
受伤:危险概率是1/3
难产(行将生育的妇女):危险概率是1/6
车祸:危险概率是1/12
心脏病突然发作(如果您已超过35岁):危险概率是1/77
在家中受伤:危险概率是1/80
受到致命武器的攻击:危险概率是1/260
死于心脏病:危险慨率是1/340
家中成员死于突发事件:危险概率是1/700
死于突发事件:危险概率是1/2900
死于车祸:危险概率是1/5000
染上爱滋病:危险概率是1/5700
被谋杀:危险概率是1/1110
死于怀孕或生产(女性):危险概率是1/4000
自杀:危险概率分别是1/20000(女性)和1/5000
因坠落摔死:危险率是1/20000
死于工伤:危险概率是1/26000
走路时被汽车撞死:危险概率是1/40000
死于癌症:危险概率是1/5
死于中风:危险概率是1/14
死于车祸:危险概率是1/45
自杀:危险概率是1/39
死于爱滋病:危险概率是1/97
死于飞机失事:危险概率是1/4000
死于狂犬病:危险概率是1/700000
如此等等,可以计算出各种情况的概率。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-25 01:11
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社