交叉分组表(Cross-tabulation table)是统计学中用来展示两个或多个变量之间关系的一种表格形式。它通过行和列来展示不同类别变量的组合情况,并通常用于频数分布的展示。
具体来说,交叉分组表有以下特点:
1. 行和列:在交叉分组表中,行和列分别代表不同的变量类别。例如,如果我们要分析性别与购买商品类型的关系,那么性别可以是行变量,购买商品类型可以是列变量。
2. 单元格:交叉分组表的每个单元格代表行变量和列变量组合的频数。例如,如果一个单元格的频数是100,那么这意味着在这个交叉分组中,有100个样本既属于行变量的这个类别,又属于列变量的这个类别。
3. 边际总计:交叉分组表通常还会提供边际总计,即每行或每列的总频数。这有助于我们了解每个变量的分布情况。
4. 条件概率:通过交叉分组表,我们可以计算条件概率,即一个变量在另一个变量给定条件下的概率。
5. 相关性分析:交叉分组表也可以用于分析两个变量之间的相关性。通过观察单元格中的频数,我们可以了解两个变量之间的关系。
以下是一个简单的交叉分组表的例子:
购买商品类型 电子产品 家居用品 服装 总计
------
男 100 50 30 180
女 80 60 40 180
总计 180 110 70 360
在这个例子中,我们可以看到,在购买电子产品方面,男性比女性更倾向于购买,而在购买家居用品方面,男性和女性的购买意愿相近。