来源:Insee,就业调查,2021 年第一季度。
当无反应率降至最低时,就会采取治疗措施来限制其影响,以区分两种形式的无反应。当它仅涉及某些问题时(我们称之为部分无响应),最常用的纠正技术是预测缺失的单个值。当无回应影响到整个问卷时,。最广泛使用的校正技术是根据受访者的权重采取行动,使他们代表未受访者。传统方法假设样本中的每个个体都可以“随机”地做出反应或不做出反应,并具有一定的概率,我们假设该概率的表达并试图计算。这个概率基于一个模型:它是根据抽样框架中可用的信息来估算的,例如根据年龄来纠正图 3中观察到的扭曲。尽管在建模过程中可以采取各种预防措施,但我们收集的信息与参与调查之间总是存在或多或少的残余关系。统计人员的目标是通过调动最相关的信息来尽量减 赌博数据 少由此产生的偏差,这再次凸显了拥有尽可能丰富的信息的抽样基础的重要性。然后将估计的响应概率与选择概率一起纳入最终权重中。由于这种方法,我们能够将无响应视为一个概率步骤,就像初始抽样一样。
就业调查的无答案修正可以使受访者结构与该领域人口结构保持一致(图 3)。这种社会人口结构的修正会对调查中感兴趣的参数的估计产生影响。例如,2021年第一季度,仅法国本土受访者的失业率就估计为7.7%。校正无回应后,估计为 8.1%。
计算生成的统计数据的置信区间
抽样理论允许计算抽样方差,它量化了估计值对样本构成方式的敏感度,同时也考虑了无响应阶段。方差较大意味着所获得的估计值在很大程度上取决于所抽取的样本和回答,这会导致传播结果的不确定性,实际上反映出调查质量较差。
从方差中,我们得出一个置信区间:它不是感兴趣参数的点估计,而是一个计算出来的“框架”,以非常高的概率包含这个参数——通常是 100 个机会中有 95 个。我们通常说的精度计算。因此,在就业调查中,2021年第一季度,法国本土的失业率估计为8.1%。以该值为中心的 95% 置信区间为 8.1% ± 0.3%,或区间为 [7.8%; 8.4%]。因此,“真实”失业率在 7.8% 至 8.4% 之间的可能性为 95%。回到无响应的破坏性影响,我们能够验证,在经过所有旨在限制它的统计处理之后,如果整个样本都有响应,那么这个置信区间的宽度将减少 3%。