音ノ木坂学院

叶え!みんなの夢――

0%

概率论和数理统计急救指南

好用的概统复习纲要

概率论部分

概率论基本概念

  1. P(A∪B) = P(A) + P(B) - P(AB) 无论AB什么关系都能用
  2. P(B|A) = P(AB)/P(A) 条件概率
  3. P(A!B) = P(A) - P(AB) 好用
  4. 一些奇怪的交和并怎么拆,一般看实际情况想一想,是不是有包含关系
  5. m次中恰有1次xx、n次yy这种,如果是逐个分配且分配完了就不用乘C(每次都是Cn1的情况下)。如果没有分配完,比如存在恰有n(n>=1 && n < m)次xxx,就需要指定是m次中的哪n次,乘C;或者二项分布,虽然分配完了,但是其中n次不明确是哪n次,也需要乘C。另外二项分布一定要把所有的项都乘上。

随机变量及其概率分布

  1. 离散性随机变量:0-1分布B(1,p),二项分布B(n,p)(n次实验,一次概率为p),泊松分布π(λ)(期望和方差都是λ)。
  2. 泊松分布:P{X=k} = e^(-λ) * λ^(k) / k!
  3. 概率分布函数 F(x)是X<=x的概率。
  4. 连续型随机变量:概率密度函数f(x) 在(a,b)上的积分是a<=X<=b的概率。
  5. 连续型随机变量:均匀分布U(a,b),正态分布N(μ,σ),指数分布E(λ).
  6. 正态分布:P{ X < b } = Φ( (b-μ)/σ ), P{ a < X < b } = Φ( (b-μ)/σ ) - Φ( (a-μ)/σ ),大于就用1-!P。常用Φ考试会给。
  7. 指数分布:f(x) = λe^(-λx) (x>0);F(x) = 1 - e^(-λx) (x>0)

多元随机变量及其分布

会出很多大题!

  1. 联合分布律就是P{X=x, Y=y}的概率。固定其中一个变量,另外一个变量此时所有可能取值相加,得到的就是边际分布率。
  2. 联合分布律那个表里所有项加起来和是1.
  3. 联合分布函数、边际分布函数分别是联合分布律和边际分布律X<=x, Y<=y的概率。
  4. 连续型二维随机变量分布函数就是求二重积分。
  5. 连续型二维随机变量边缘密度函数就是另外一个变量从负无穷积到正无穷,待求变量从负无穷到阈值。边缘密度函数就是再求导。
  6. 连续型二维随机变量的条件分布:用密度函数和边缘密度函数做。
  7. X和Y相互独立的时候,其分布函数和密度函数均独立。
  8. Z=X+Y的分布

随机变量的数字特征

  1. 期望和方差的公式
  2. 协方差和相关系数Cov(X,Y)/sqrt[D(X)D(Y)],xy独立的时候相关系数为0.
  3. 常见随机变量分布的期望和方差

大数定律及中心极限定理

  1. 切比雪夫不等式和大数定律
  2. 使用中心极限定理估计概率:P(a<=ΣXk<=b)=Φ( (b-μ)/σ ) - Φ( (a-μ)/σ )

数理统计部分

统计量与抽样分布

  1. k阶(原点)矩就是x到原点的距离的k次方的均值;k阶中心矩就是到X均值的距离的k次方的均值。
  2. 卡方分布:E=n, D=2n。两个卡方分布相加,还是卡方分布,参数为参数之和。
  3. t分布
  4. F分布

参数估计

  1. 总体是正态分布的时候,矩估计值=极大似然估计值。
  2. 矩法:根据参数个数列出一阶或二阶方程(就是X和X方的期望),注意由于这里数据已知,期望方差等全部是已知;根据方程解出未知参数,用样本矩A(期望)和B(方差)来表示。
  3. 极大似然法:X~f(x,θ),似然函数L(θ)=∏f(x,θ);对上式两边取对数,求导,令dlnL/dθ = 0,解出参数。或者用单调性判断也可以。
  4. E(θ^)=θ,则称θ^为θ的无偏估计量;θ1^,θ2^是两个无偏估计量,若D(θ1^)<D(θ2^),则称θ1比θ2有效;θn^是θ的一串估计量,若对任意ε有lim P(|θn^-θ|>ε)=0,则称θn^是θ的一致估计量/相合估计量。
  5. θL^<θU^,且P{θL^<θ<θU^}>=1-α,则(θL^,θU^)为θ的置信水平为1-α的置信区间,θL^和θU^分别成为置信下限和置信上限。
  6. 上式等号成立时的区间称为同等置信区间。
  7. 求解同等置信区间:枢轴量法
  8. µ的置信区间:σ^2已知;σ^2未知;成对数据。
  9. σ^2的置信区间:µ未知。
  10. µ1-µ2:σ1^2、σ2^2已知;σ1^2=σ2^2未知。
  11. σ1^2/σ2^2:µ1,µ2未知。
  12. 表还是要背一下的

假设检验

  1. 检验规则:关键是求|样本X均值-µ|>=C的阈值C
  2. 提出原假设H0和备择假设H1, 两类错误:α,拒绝了一个真实的原假设;β,接受了一个错误的原假设。
  3. 如何求C:α(C)使用条件概率公式展开,两边除以σ/sqrt(n),转化为正态分布概率分布,用Φ表达(含C),使用给定的显著水平α(0.01,0.05,0.10等), 解出C。
  4. 根据奈曼-皮尔逊原则,求出拒绝域W中的临界值。根据W和X-比较,决定拒绝还是接受原假设。
  5. 方法二:计算最小显著水平:P_:原假设H0为真的时候,检验统计量取比观察到的结果更为极端的数值的概率。计算检验统计量的观测值和P_值,P_越小,拒绝H0的理由越充分。P_<=α拒绝原假设。根据给定的显著水平α作出判断。
  6. 第一种方法关键是用已知的µ,σ和n计算Z,和给定α的Z作比较。第二种方法关键是算出P_,和给定的α作比较。
  7. 表还是要背一下的,虽然都是方法一

方差分析与回归分析

  1. 会填表,剩下的随缘了