列联(交叉)分析
# 列联(交叉)分析
# 1、作用
列联(交叉)分析用于分析两两分组变量之间的交叉分布,然后比较各组的分布状况,以寻找变量间的关系。
# 2、输入输出描述
输入:一个定类变量X与一个或者多个字段Y。
输出:两两分组变量之间的交叉分布情况。
# 3、案例示例
案例:不同地区(城市/农村)和性别的同学在玩电脑游戏的分布状况。
# 4、案例数据
列联(交叉)分析算法案例数据
一个定类变量X与一个或者多个字段Y指的是:定类变量X(性别)作为分组变量,多个字段Y(地区/玩电脑游戏情况)指的是待分析变量。若输入多个定类/定量变量,则为以已经拖入的分组变量对多个定类/定量变量重复分析。
# 5、案例操作
Step1:新建分析;
Step2:上传文件;
Step3:选择对应数据打开后进行预览,确认无误后点击开始分析;
Step4:选择【列联(交叉)分析】;
Step5:查看对应的数据数据格式,【列联(交叉)分析】要求输入数据一项为定量变量,其他定量/定类变量,选择对应分析类型(当变量为定量变量时,会自动进行四分位分组);
Step6:点击【开始分析】,完成全部操作。
# 6、输出结果分析
输出结果 1:列联表
图表说明:上表展示了以性别为分组项,以地区、玩电脑游戏情况为分析项的列联交叉分析结果,包括变量、频数、百分比等,需要注意的是:
- 若交叉表过大(列超过15项),请点击右上角下载按钮导出查看;
- 若分析项为定量变量(样本量N≥8),系统默认以四分位进行分组,若想生成更多分组,请使用数据处理—>数据编码;
- 若想分析基于分组项下,各分析项是否存在差异以及程度,可以选择卡方分析。
结果分析:由图可见,一周玩电脑游戏 4 个小时以上的同学占比最多。
且虽然女性本身数量比男性多约百分之十,但是男女玩游戏情况比例差距不大,可认为男同学稍微更热衷于电脑游戏。而来自城市的同学比来自农村的同学多出很多,城市和农村内部的男女比例则基本跟总的男女比例一致。
输出结果 2:交叉图
图表说明:上图展示了列联交叉分析结果,包括变量、频数、百分比等。
# 7、注意事项
- 若分析项为定量变量,SPSSPPRO 默认以四分位进行分组,若想生成更多分组,请使用数据处理—>数据编码。
- 若想分析基于分组项下,各分析项是否存在差异以及程度,可以选择卡方分析。
# 8、模型理论
列联表(contingency table)
是观测数据按两个或更多属性(定性变量)分类时所列出的频数表。它是由两个以上的变量进行交叉分类的频数分布表。
一般,若总体中的个体可按两个属性
# 9、参考文献
[1] Scientific Platform Serving for Statistics Professional 2021. SPSSPRO. (Version 1.0.11)[Online Application Software]. Retrieved from https://www.spsspro.com.
[2] 贾俊平、何晓群、金勇.统计学(第四版):中国人民大学出版社,2009 年:246
[3] 胡良平, 陶丽新. R×C 列联表资料的统计分析与 SAS 软件实现(一)[J]. Journal of Integrative Medicine(结合医学学报(英文)), 2009, 7(08):784-787.