290 likes | 638 Views
MATLAB 在概率统计中的应用 1 求平均值 一组数据用 x 表示 则 mean(x) 为各元素的 算术 平均 而 sum(x.*p) 为该组数据的 加权 平均, p 为对 应数据的权重 其他命令包括: max, min, median (中位数) , sort (递增排序) , range (级差), sum ( 向量 x 的元素总和 ) , cumsum ( 向量 x 的累计元素总和 ).
E N D
MATLAB在概率统计中的应用 1 求平均值 一组数据用x表示 则 mean(x)为各元素的算术平均 而 sum(x.*p)为该组数据的加权平均,p为对 应数据的权重 其他命令包括: max, min, median(中位数), sort(递增排序), range(级差), sum(向量x的元素总和 ), cumsum(向量x的累计元素总和 )
例 测得8组数据为(以 mm计)74.001,74.005,74.003,74.001,74.000,73.998,74.006,74.002。试求样本的均值。 d=[74.001 74.005 74.003 74.001 74.000 73.998 74.006 74.002] mean(d) 例 设随机变量X的分布律见表 ,求E(X)和E(3 +5 )的值。 x -2 0 2 Pk 0.4 0.3 0.3 x=[-2 0 2]; Pk=[0.4 0.3 0.3] sum(x.*pk)
z=3*y+5 sum(z.*pk) 方差和标准差 方差:D(x)=E{[x-E(x)]2} 标准差:(x)=sqrt(D(X)) 命令函数:var(x) %方差 var(x,1) var(x,w) std(x) %标准差 std(x,1) %计算列标准差
例 对例 1中的样本值d ,求其方差值、样本方差值、标准差、样本标准差的值 解: d=[74.0010 74.0050 74.0030 74.0010 74.0000 73.9980 74.0060 74.0020] x1=var(d,1) , x2=var(d), x3=std(d,1) , x4=std(d) • x1 = 6.0000e-006 • x2 = 6.8571e-006 • x3 = 0.0024 • x4 = 0.0026
例 有15名学生的体重(单位为 kg)为75.0,64.0 ,47.4,66.9,62.2,62.2,58.7,63.5,66.6,64,57.0,61.0,56.9,50.0,72.0。计算此15名学生体重的均值、标准差 解: w=[75.0,64.0 ,47.4,66.9,62.2,62.2,58.7,63.5,66.6,64,57.0,61.0,56.9,50.0,72.0]; mean1=mean(w) std1=std(w)
9.1.6 协方差和相关系数 协方差 cov(x,y)=E{[x-E(x)][y-E(y)]} 相关系数 cov(x,y) cov(x,0) cov(x,1) corrcoef(x,y) corrcoef(x) 例 协方差矩阵函数和相关系数函数应用示例。 a=[1,2,1,2,2,1] var(a) cov(a) d=rand(2,6) cov1=cov(d) conzhi=cov1(2)
9.1.7 协方差矩阵 例:c=rand(3,3) cov(c) corrcoef(c) 9.2常用的统计分布量 9.2.1 期望和方差 例 求参数0.12和0.34的 分布的期望和方差。 解: [m,v]=betastat(0.12,0.34) 例 按规定,某型号的电子元件的使用寿命超过1500小时为一级品,已知一样品20只,一级品率为0.2,问样品中一级品元件的期望和方差为多少?
[m,v]=binostat(20,.2) 例 求参数为6的泊松分布的期望和方差 [m,v]=poisstat(6) 9.2.2 概率密度函数 pdf(name,x,a,b,c) 例 计算正态分布N(0,1)下的在点0.7733的值。 pdf(‘norm’,0.7733,0,1) normpdf(0.7733,0,1) 例 绘制卡方分布密度函数在 n分别等于1,5,15的图. clf x=0:0.1:30; y1=chi2pdf(x,1); plot(x,y1,’:’)
hold on y2= chi2pdf(x,5); plot(x,y2,’+’) y3= chi2pdf(x,15); plot(x,y3,’o’) axis([0,30,0,0.21]) 9.2.3 概率值函数(概率累积函数) 例 某一公安在长度为t的时间间隔内收到的紧急呼救次数服从参数为 t/2的泊松分布,而与时间间隔起点无关(时间以小时计) 求 (1)在某一天中午12时至下午3时没有收到1呼救的概率 (2)在某一天中午12时至下午5时至少收到1次紧急呼救的概率
解:poisscdf(0,1.5) poisscdf(0,2.5) 例 设X~N(3,) (1)求P{2<X<5},P {-4<X<10},P {|X|>2},P {X>3}; (2)确定c使得P {X>c}= P {X<c}. P{2<X<5} a1=normcdf(2,3,2) a2=normcdf(5,3,2) p=a2-a1 P {-4<X<10} p=normcdf(10,3,2)-normcdf(-4,3,2)
P {|X|>2} p=1- normcdf(2,3,2)+ normcdf(-2,3,2) P {X>3} p= 1- normcdf(3,3,2) 9.2.4 分值点函数 例 求上例的第(2)问 解: 若要P {X>c}= P {X<c},则P {X>c}= P {X<c}=0.5, norminv(0.5,3,2) 例 在假设检验中常用到求分值点的问题,如当 时,求Z(0.05/2)和T(0.05/2,10)
norminv(0.025,0,1) tinv(0.025,10) 9.3.1 正态分布参数估计 例 假设某种清漆的9个样品,其干燥时间(以小时计)分别为6.0.5.7,5.8,6.5,7.0,6.3,5.6,6.1,5.0.设干燥时间总体服从正态分布。 解:time=[6..0 5.7 5.8 6.5 7.0 6.3 5.6 6.1 5.0] ; [MUHAT,SIGMAHAT,MUCI,SIGMACI]=normfit( time,0.05)
例 分别使用金球和铂球测定引力常数 (1)用金球测定观察值为:6.683,6.681,6.676,6.678,6.679,6.672; (2)用铂球测定观察值为:6.661,6.661,6.667,6.667,6.664. 解:j=[6.683,6.681,6.676,6.678,6.679,6.672]; b=[6.661,6.661,6.667,6.667,6.664]; [MUHAT,SIGMAHAT,MUCI,SIGMACI]=normfit( j,0.1) [MUHAT,SIGMAHAT,MUCI,SIGMACI]=normfit( b,0.1)
9.3.2指数最大似然参数估计 例 已知以下数据为指数分布,求它的置信度为0.05的参数的估计值和区间估计。数据为1,6,7,23,26,21,12,3,1,0。 解: a=[1,6,7,23,26,21,12,3,1,0]; [MUHAT,MUCI]=expfit(a,0.05) 9.4 区间估计 9.4.1 Gauss-Newton法的非线性最小二乘数据拟合 nlinfit nlinfit(X,Y,’MODEL’,BETA0) [BETA,R,J]= nlinfit(X,Y,’MODEL’,BETA0)
9.4.2 非线性拟合预测的交互图形工具 nlintool nlintool (X,Y, MODEL,BETA0,ALPHA) nlintool (X,Y, MODEL,BETA0,ALPHA,XNAME, YNAME) 9.4.3 非线性最小二乘预测的置信区间 nlpredci [YPRED, delta]=mlpredci(MODEL,INPUTS,XF,J) 9.4.4非线性模型的参数置信区间 nlparci CI=nlparci(X,F,J)
9.4.5 非负最小二乘 nnls x=nnls(A,b) [x,w]=nnls(A,b) 9.5 假设检验 9.5.1 单个总体 均值 的检验 例 设某车间用一台包装机包装葡萄糖,包得的袋装糖重量是一个随机变量,它服从正态分布。当机器正常时,其值均为0.5公斤,标准差为0.015。某日开工后检验包装机是否正常,随机的抽取它所包装的糖9袋,称得净重为(公斤)0.497,0.506,0.518,0.524,0.498,0.511,0.52,0.515,0.512
x=[0.497,0.506,0.518,0.524,0.498,0.511,0.52,0.515,0.512] x=[0.497,0.506,0.518,0.524,0.498,0.511,0.52,0.515,0.512] [H,sig]=ztest(x,0.5,0.015,0.05,0) • 未知时的 检验(t检验法) 例 某种电子元件的寿命X(以小时计)服从正态分布, 均未知。现测得16只元件的寿命如下所示: 159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170 x=[159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170] [H,sig]=ttest(x,225,0.05,1)
9.5.2 两个正态总体均值差的检验(t检验) 例 在平炉上进行一项试验以确定改变操作方法的建议是否会增加钢的得率,试验是在同一只平炉上进行的。每炼一炉钢时除操作方法外,其他条件都尽可能做到相同。先用标准方法炼一炉,然后用建议的新方法炼一炉,以后交替进行,各炼10炉,其得率分别为: (1)标准方法 78.1,72.4,76.2,74.3,77.4,78.4,76.0,75.5,76.7,77.3 (2)新方法 79.1,81.0,77.3,79.1,80.0,79.1,79.1,77.3,80.2,82.1 设这两个样本相互独立,且分别来自正态总体
均未知。 问建议的操作方法能否提高得率(取 )? 解:x=[78.1,72.4,76.2,74.3,77.4,78.4, 76.0,75.5,76.7,77.3] y=[79.1,81.0,77.3,79.1,80.0,79.1,79.1, 77.3,80.2,82.1] [H,sig,ci]=ttest2(x,y,0.05,-1) 9.5.3 秩和检验 例 某商店为了确定向公司A或B购买某种商 品,将A,B公司以往的各次进货的次品率进行 比较,数据如下,设两样本独立。问两公司的
商品的质量有无显著差异。设两公司的商品的次品密度最多只差一个平移,取 。 A 7.0 3.5 9.6 8.1 6.2 5.1 9.4 4.0 2.0 10.5 B 5.7 3.2 4.2 11.0 9.7 6.9 3.6 4.8 5.6 8.4 10.1 5.5 12.3 分别以 记公司A,B的商品率总体的均值。所需检验的假设为 a=[7.0 3.5 9.6 8.1 6.2 5.1 9.4 4.0 2.0 10.5] ; b=[5.7 3.2 4.2 11.0 9.7 6.9 3.6 4.8 5.6 8.4 10.1 5.5 12.3] [p,H]=ranksum(a,b,0.05)
9.5.4 中值检验 1 signrank函数 signrank P= signrank(x,y,ALPHA) [P,H]= signrank(x,y,ALPHA) 2 signtest函数 signtest P= signtest (x,y,ALPHA) [P,H]= signtest(x,y,ALPHA) 9.6方差分析和回归诊断 9.6.1方差分析 anoval(x)
例 设有三台机器,用来产生规格相同的铝合金薄板。取样、测量薄板的厚度精确至千分之一厘米。得结果如下: 机器1 0.236 0.238 0.248 0.245 0.243 机器2 0.257 0.253 0.255 0.254 0.261 机器3 0.258 0.264 0.259 0.267 0.262 检验各台机器所产生的薄板的厚度有无显著的差异? x=[0.236 0.238 0.248 0.245 0.243; 0.257 0.253 0.255 0.254 0.261; 0.258 0.264 0.259 0.267 0.262]; anoval(x’)
2 双因素试验的方差分析 anova2(X,REPS) 例 一次火箭使用了4种燃料,3种推进器做射程试验,每种燃料与每种推进器的组合各发射火箭两次,得到如下结果。 推进器(B) B1 B2 B3 A1 58.2000 56.2000 65.3000 52.6000 41.2000 60.8000 A2 49.1000 54.1000 51.6000 燃料(A) 42.8000 50.5000 48.4000 A3 60.1000 70.9000 39.2000 58.3000 73.2000 40.7000 A4 75.8000 58.2000 48.7000 71.5000 51.0000 41.4000
解:a=[58.2000 56.2000 65.3000 52.6000 41.2000 60.8000 49.1000 54.1000 51.6000 42.8000 50.5000 48.4000 60.1000 70.9000 39.2000 58.3000 73.2000 40.7000 75.8000 58.2000 48.7000 71.5000 51.0000 41.4000 ]; anova2(a,2) 9.6.2 回归分析 例 为了研究某一化学反应过程中,温度X对产品得率Y的影响,测得数据如下
温度x 100 110 120 130 140 150 160 170 180 190 得率y 45 51 54 61 66 70 74 78 85 89 试做y=a+bx型的回归。 解:x=[100 110 120 130 140 150 160 170 180 190 ] y=[45 51 54 61 66 70 74 78 85 89] [a,b]=polyfit(x,y,1) 9.7统计图 9.7.1 直方图 hist 9.7.2 角度扇形图 rose 9.7.3 正态分布图 h=normplot 例:x=normrnd(0,1,100000,1); normplot(x)
9.7.4 参考线 refline(SLOPE,INTERCEPT) refline(SLOPE) H= refline(SLOPE,INTERCEPT) 9.7.5 显示数据采样的盒图 例:x=normrnd(0,1,10000,1); boxplot(x,1,’+’,1) 9.7.6 对离散图形加最小二乘法直线 例:a=[0.1,0.3,0.4,0.55,0.7,0.8,0.95]; b=[15,18,19,21,22.6,23.8,26]; plot(a,b,”*”);lsline 9.7.7 QQ图 qqplot(x,y)
例:plot(a,b,’*’) qqplot(a,b)
9.8 函数的最小值 9.8.1 单变量函数的最小值 x=fmin(‘F’,x1,x2) F为目标函数,x为返回的区间 [x1,x2] 内的 函数最小值所对应的自变量坐标。 例: 求函数 (x3+cosx+xlogx)/ex 在(0,1)区间的 最小值点。 fmin(‘(x^3+cos(x)+x*log(x))/exp(x)’,0,1)
9.8.2 多变量函数的最小值 x=fmins(‘F’,x0) F为多变量目标函数 x0为预估最小值对应的坐标 x为fmins返回的函数最小值对应的坐标值 F,x0,x均为矩阵形式 例: 求函数2x13+4x1x23-10x1x2+x22的最小值点