type
status
date
slug
summary
tags
category
icon
password
样本与抽样分布
总体和样本的关系
,样本→总体
经验分布函数→总体的分布函数(格里汶科定理)
相关定义
名称 | 含义 | 典型用途 | 意义 |
样本 k 阶原点矩 | 数据关于原点的 k 次方的平均值 | 描述整体分布形状 | 绝对位置 |
样本 k 阶中心矩 | 数据关于均值的偏差的 k 次方的平均值 | 分析分布的对称性和尾部特征 | 相对位置 |
其中k阶原点矩也是k阶样本的均值。
分位点
三大分布
分布
,
- 可加性
- 期望
- 方差
t分布
,,
F分布
- 倒数性质
相关性质
- 随机变量与总体同分布
- 来自总体的随机变量的期望都等于总体的期望
- 来自总体的随机变量的方差都等于总体的方差
单个总体
两个总体
参数估计
根据样本给出参数的近似值或者可信程度
点估计
样本:(概念),其观察值为样本值(数)
- 构造适当的统计量,即估计量
- 用观察值作为近似值,即估计值
矩估计法
样本矩依概率收敛于总体矩
步骤:
有几个未知参数就要求几阶矩(几个未知数就有几个方程)
二阶矩常用方差公式计算
例
二级结论:总体均值和方差的矩估计量与X分布无关
有了这个结论,可以直接计算均值和方差的矩估计量。
最大似然估计法
- 分别列出样本等于观察值的概率,相乘,得到能够反映样本贴合观察值的函数。其大小由未知的参数控制。
- 这个函数就是似然函数。
- 所以只需要求出似然函数并求最值即可。
步骤:
- 求似然函数
- 取对数(为了求导方便)
- 对未知参数求偏导(多未知数:分别求偏导得到方程组)
- 令导函数为0求出最值取值(多未知数:解方程组)
例
最大似然估计不变性:求出的最大似然估计可以通过自身关系迁移到其他量,得出的量也是最大似然估计。
例:
评选标准
无偏性
估计量数学期望等于本身
则为无偏估计量
二级结论
形如
的估计量,其为无偏估计量的充要条件是其系数和为1,如
有效性
估计量方差越小越好
则较有效
置信区间
置信区间是一个区间估计方法,用于以某种置信水平来估计总体参数的取值范围。
给定置信水平,我们可以构造一个区间,使得该区间包含真实参数值的概率为。
枢轴量
- 正态分布( 已知求 )
令
得的一个置信区间
- t分布( 均未知)
令
得的一个置信区间
- 分布( 未知)
令
得的一个置信区间
标准差的置信区间两边根号就行。
以下讨论两个总体的情况
- 两个总体均值差的置信区间
- 均已知(正态分布)
- ,但未知(t分布)
置信区间
置信区间
- 两个总体方差比的置信区间,未知
置信区间
假设检验
根据给定的部分参数,提出对未知参数的假设,通过对拒绝域的分析判断是否能接受假设。
步骤:
- 提出假设:,两个假设是对立的
- 选取检验统计量(枢轴量)
- 已知:(U检验)
- 未知:(T检验)
- ……具体看表
- 求拒绝域(下设u为检验统计量)
- 令
- 解得
- 带入已知的值进表达式,结果与比较,判断是否落入拒绝域
- 得出结论