卡方分布(Chi-squared distribution)是统计学中的一种连续概率分布,它描述了从正态分布的随机变量中独立地抽取样本,并计算这些样本的平方和后,除以相应的自由度所得到的随机变量的概率分布。
具体来说,卡方分布有以下几个特点:
1. 定义:卡方分布是所有独立标准正态分布随机变量平方和的概率分布。假设有n个独立的标准正态分布随机变量(X_1, X_2, ..., X_n),那么它们的平方和(X_12 + X_22 + ... + X_n2)就服从自由度为n的卡方分布。
2. 自由度:自由度是卡方分布的一个关键参数,它表示在计算卡方分布时,独立变量的数量。自由度通常用符号ν表示。
3. 形状:卡方分布的形状随着自由度的增加而变化。当自由度较小时,分布的尾部较厚;当自由度较大时,分布接近正态分布。
4. 应用:卡方分布广泛应用于统计学中,尤其在假设检验和方差分析中。以下是一些常见的应用场景:
卡方检验:用于检验两个或多个样本的方差是否相等。
拟合优度检验:用于检验某个概率分布是否与实际数据拟合得很好。
方差分析:用于比较多个样本的均值是否相等。
5. 数学公式:卡方分布的概率密度函数(PDF)可以表示为:
[
f(x; nu) = frac{1