表面上看,数据缺失似乎只是个琐碎的麻烦,而非实质性问题。申请者自愿申报的种族与性别数据尤其如此。然而根据我们的经验,数据缺失实则是平权行动合规过程中最易被忽视的威胁之一。遗憾的是,多数承包商直到深陷联邦合约合规办公室(OFCCP)审计时才意识到这一点。本文旨在帮助联邦承包商深入理解数据缺失问题,具体将探讨:
- 什么是缺失数据?
- 数据缺失的后果——导致AAP/EEO分析不准确。
- 最佳实践——如何应对这一威胁。
第一部分:什么是缺失数据?
通常,分析师将缺失数据视为数据集中简单的空白信息。然而在实践中,并非所有缺失数据都相同。在AAP/EEO中,缺失数据存在两种形式:
- 随机缺失(MAR)
- 非随机缺失(nMAR)
随机缺失(MAR)
研究表明,数据缺失很少是随机发生的。虽然难以证明相反情况,但分析人员应避免在未进行基本调查的情况下,将缺失数据视为随机缺失(MAR)。
在实际操作中,在AAP/EEO分析中,MAR数据的问题最小。由于数据是随机缺失的,其缺失模式不具系统性,且所有群体(性别、种族)均受同等影响。请看以下示例:
| 缺失数据 | 分析 | 男 | 女性 | 总计 |
| 无遗漏 | 计数 (#) | 70 | 30 | 100 |
| 百分比(%) | 70% | 30% | ||
| MAR | 计数 (#) | 35 | 15 | 50 |
| 百分比(%) | 70% | 30% |
当数据无缺失时,我们看到总申请人数为100人,其中男性70人(70%),女性30人(30%)。当数据随机缺失时,对男性和女性申请人的影响是相等的。我们看到,在有规律缺失(MAR)的数据中,男性申请者占70%,女性申请者占30%。
正如本例所示,MAR数据最显著的后果是样本量缩小。从分析角度看,样本量缩小会降低统计功效。以防御为导向的从业者或许会因分析或联邦合同合规计划办公室(OFCCP)无法检测出显著性而感到欣喜,但这种态度既短视又错误。第二部分将对此问题进行更深入的探讨。
非随机缺失(nMAR)
现实世界中缺失数据存在不同程度的系统性模式。非均值缺失数据(nMAR)可能导致偏倚,并以不可预测的方式扭曲分析结果。例如,非裔美国人申请者可能因担心种族信息与申请结果存在关联,而倾向于不主动披露自身种族背景。
这并不令人意外,尤其考虑到针对少数族裔申请者需要粉饰简历的研究。另一方面,鉴于社会对劳动力多元化的高度关注,白人申请者可能不会主动披露种族信息。根据职位性质和社会环境,非种族相关信息缺失(nMAR)可能呈现不同形态——这种系统性影响的方向性难以预测。综合来看,申请者信息缺失很可能在不同程度上属于nMAR数据范畴。
可以理解的是,在审计情境中,非计量分析(nMAR)可能引发严重后果。下一节将详细阐述计量分析(MAR)与非计量分析(nMAR)数据对分析有效性构成的三项威胁。
第二部分:不准确的AAP/EEO分析
研究人员长期以来都认识到数据缺失的问题。这种缺失会人为地偏倚分析结果,导致误导性的发现和结论。对于承包商而言,这些影响可能不必要地引起联邦合同合规计划办公室(OFCCP)的关注和审查。当申请者数据存在缺失时,承包商可能面临以下三种常见问题:
- 人为地赋予重要性的分析
- 人为无意义分析
- 一对一申请者转为录用者
问题1:人为重要性分析
重大不利影响、资源利用不足及短缺问题是审计中承包商面临的主要痛点。以下示例中,申请者数据因nMAR问题影响男性申请者。当数据无缺失时,男性与女性申请者的选拔率相同(均为70%)。
然而,当缺失数据存在系统性模式且影响男性申请者时,我们仅能确认12名未获录用的男性申请者;其余18名男性申请者的状态为未知。因此,在审计中观察到的男性录用率(85%)显著高于女性(70%),(标准差=2.00)。
| 缺失数据 | 集团 | 雇佣状态 | 统计量 标准差 |
|
| 是 | 没有 | |||
| 无遗漏 | 男 | 70 | 30 | 0.00 |
| 女性 | 35 | 15 | ||
| nMAR | 男 | 70 | 12 | 2.00 |
| 女性 | 35 | 15 | ||
注:作为最佳实践,对于几乎所有被录用的未知申请人,均可识别其人口统计数据。
显然,这一具有统计学意义的发现是人为造成的,完全源于nMAR数据对男性申请者造成的影响。
问题2:人为制造的非显著性利用率分析
另一方面,nMAR可能导致检测结果不具统计学意义。这可能源于两种效应:1) 选择率的变化;以及/或 2) 检测显著性的统计功效降低。虽然注重防御的从业者可能为此欣喜,但正如前文所述,这种态度实属短视。以下案例展示了nMAR如何影响女性申请者:
| 缺失数据 | 集团 | 雇佣状态 | 统计量 标准差 |
|
| 是 | 没有 | |||
| 无遗漏 | 男 | 70 | 30 | 4.60 |
| 女性 | 15 | 35 | ||
| nMAR | 男 | 70 | 30 | 1.95 |
| 女性 | 15 | 15 | ||
注:作为最佳实践,对于几乎所有被录用的未知申请人,均可识别其人口统计数据。
当数据无缺失时,男性申请者的录用率(70%)显著高于女性申请者(30%),(标准差=4.60)。 然而,当缺失数据存在系统性模式影响女性申请人时,我们仅能确认15名未获录用的女性申请人;其余20名女性申请人的状态为未知。因此,男性的实际录用率(70%)与女性(50%)相比不再显著更高(标准差=1.95)。
若这些结果是在年度AAP框架下得出,承包商将忽略该特定职位组。但在审计情境中,通过额外的数据精炼与清理,成功追溯到一名额外的女性申请者(未录用)。 在此案例中,仅因新增一名女性申请者,承包商才迟至此时意识到女性录用率远低于男性。事实上,任何旨在恢复数据的清理工作只会加剧问题——由于仅会增加女性未录用人数,这种非平均录用率效应(nMAR)对女性申请者更为不利。
| 缺失数据 | 集团 | 雇佣状态 | 统计量 标准差 |
|
| 是 | 没有 | |||
| nMAR | 男 | 70 | 30 | 2.13 |
| 女性 | 15 | 16 | ||
问题3:申请者与录用者的一对一对应关系
承包商发现自己有录用人员却没有应聘者数据的情况并不少见。有些情况下应聘者数据未被采集,但多数情况下应聘者数量较少,且无人主动提供自身人口统计信息。在这种情况下,承包商只能"恢复"应聘者数据记录。实际上,这意味着他们只能恢复已录用个人的相关人口统计数据。以下是一个典型案例:
| 缺失数据 | 集团 | 雇佣状态 | 统计量 标准差 |
|
| 是 | 没有 | |||
| 无遗漏 | 男 | 2 | 0 | 1.98 |
| 女性 | 0 | 5 | ||
| nMAR | 男 | 2 | 0 | 0.00 |
| 女性 | 0 | 0 | ||
注:作为最佳实践,对于几乎所有被录用的未知申请人,均可识别其人口统计数据。
在此示例中,有两名男性录用者而无女性录用者。若100%的应聘者数据缺失,仍可"恢复"两名男性应聘者——仅因他们已被录用,且其全部人口统计数据可从员工数据文件中获取。 至于五名女性申请者,由于她们未被录用且未出现在员工数据文件中,因此无法恢复。由此,该招聘分析被称为"一对一"录用——所有申请者均获得录用。
实际上,联邦合同合规计划办公室(OFCCP)对承包商在获取高质量应聘者数据方面面临的困难表现出相当程度的理解。然而,若出现过多的"一对一"招聘情况,则极易引起注意并受到该机构的审查。
第三部分:最佳实践
申请者数据中存在信息缺失是可预见的,因为种族、性别及其他人口统计数据的自我申报属于自愿行为。因此,承包商只能尽力确保其申请者数据尽可能完整。以下是承包商应遵循的两项最佳实践:
- 要求申请人若不愿自我认同,则需选择“我选择不披露”。
- 从已录用员工的档案中“恢复”人口统计数据。
要求申请人选择
尽管无法强制要求求职者披露其种族和性别,但可以妥善记录其拒绝自我认定的选择。最佳实践是要求求职者选择种族或性别类别,或选择"我选择不披露"。这种求职者追踪系统(ATS)设置具有两大重要优势:
-
- 若申请人拒绝选择任何可用选项(包括"我选择不披露"),则无法继续操作,技术上将无法完成申请,从而被排除在选拔流程之外。此举有效杜绝了数据缺失现象,并准确识别出拒绝自我标识为"我选择不披露"的个人。
- 本方法记录了承包商为收集申请者人口统计数据所做的努力。通过完善记录,在审计中因数据缺失引发合规违规的风险将显著降低。遗憾的是,许多承包商因缺乏充分证据解释申请者人口统计信息缺失比例异常偏高的情况,最终只能接受调解协议。
恢复申请人信息
在某些情况下,缺失的应聘者信息可被追溯补充。应聘者在求职阶段可能选择不主动申报其人口统计信息,但一旦成为正式员工,通常(绝大多数情况下)必须披露相关人口统计数据(如种族和性别)。 若应聘者在申请过程中拒绝自我申报,但最终被录用,则可通过员工档案信息(如种族和性别)更新其应聘者数据。此举可能对整体结果产生显著影响,尤其当大量未知应聘者被录用时。
摘要与结论
对于大多数承包商而言,缺失数据绝非无足轻重。本文旨在帮助承包商提高对缺失数据的认知与理解。首先需要明确的是,并非所有缺失数据都具有相同性质。 部分数据属于随机缺失(MAR),部分则属于非随机缺失(nMAR)。实践中,缺失数据通常属于nMAR类型,这会导致数据产生偏差,进而使分析结果失去可靠性。当存在大量缺失数据时,"一对一招聘"现象便不可避免,这可能引发联邦合同合规计划办公室(OFCCP)对数据可靠性的审查。最终,申请者人口统计信息并非强制要求,OFCCP对此予以理解。 承包商只需记录其流程,以证明已采取适当措施让申请人进行自我申报。研究人员多年来一直为缺失数据问题所困扰,目前尚无简单解决方案。本文希望能揭示这一常被忽视却十分严重的问题——许多承包商对此尚不了解。
如需了解更多关于缺失数据及一般性AAP/EEO援助的信息,请随时通过电子邮件[email protected]或致电800-999-0438联系Biddle咨询集团。
编者按:本文最初发表于 Circaworks.com。2023 年 4 月,Mitratech 收购了包容性招聘和 OFCCP 合规软件的领先供应商 Circa。此后,我们对内容进行了更新,以反映我们扩大的产品范围、不断发展的人才招聘合规法规以及人力资源管理的最佳实践。