导言
联邦合同合规计划办公室(OFCCP)于2019年7月23日发布多份常见问题解答,旨在为联邦承包商理解并遵守反歧视法规提供进一步指导。《平等就业机会分析中的实际意义》试图厘清何时统计学上的显著差异可能具有实际意义,从而需要采取行动。 尽管常见问题解答指出内容适用于一般雇佣结果,但其核心关注点似乎在于雇佣选择环节。然而相同原则同样适用于薪酬差异等其他雇佣结果。虽然关于实际意义与统计意义的讨论并非新鲜话题,但随着企业可接触的应聘者群体日益庞大——尤其在招聘决策过程中——该议题的重要性已显著提升。 随着人才池规模扩大,选拔率(或测试分数)的微小差异更可能达到统计显著性,从而面临法律挑战。下文将界定实际显著性与统计显著性的定义,阐释OFCCP常见问题解答中描述的实际显著性"测试",并为雇主提供建议。
统计显著性检验在平等就业机会分析中的重要性
《雇佣甄选程序统一准则》(UGESP,1978年)提供了评估雇员甄选程序不利影响的相关信息。该准则阐述了四分之三或80%规则,规定若弱势群体的录用率低于优势群体的80%,则构成不利影响的证据。 四分之三规则为雇主评估选拔程序的不利影响提供了相对简便的方法。但该指南同时指出,此规则并非统计检验。随着技术与软件的普及,如今计算选拔率差异的统计显著性已变得更为便捷。 随着雇主持续追踪并保存多年申请者数据集,加之联邦合同合规计划办公室(OFCCP)开始要求并分析多年数据,出现至少一项统计指标的概率显著提升。
统计学与实践意义的定义
Statistical significance indicates that some measured outcome (e.g., differences in selection rates between males and females) did not occur by chance. If the difference in selection rates between males and females, for example, is too large to attribute to chance, the difference is statistically significant and an indication that the difference can be attributed to gender or something related to gender. In terms of tests or assessments, either the difference in test scores or the difference in pass rates is too large to attribute to chance. Common thresholds for statistical significance include a two (or three) standard deviation difference or a p-value (i.e. probability value) less than .05. While a statistically significant difference seems like a reasonable indicator for further investigation of a selection procedure, statistical significance depends not only on the size of the difference but also on the size of the group under consideration. That is, smaller groups require larger differences to trigger the 2 s.d. or p<.05 threshold, and larger groups require smaller differences to yield a statistically significant result. For example, for pools of 1,000 applicants, selection rate differences of as little as 7.9% will be statistically significant and for pools of 5,000 applicants, selection rate differences of as little as 2.1% will be statistically significant1.
实践意义旨在评估观察到的差异是否具有实质性。若选拔率差异为5%,这是否具有实质意义?若预期通过考试人数与实际通过人数(即缺口)的差异为每10,000名通过者中存在10人缺口,这是否具有实质意义? 联邦合同合规计划办公室(OFCCP)的常见问题解答明确列举了若干实用显著性衡量标准,这些标准均基于法律先例、通用雇佣标准计划(UGESP)或相关领域出版物。其中特别提及影响比率、比值比、翻转规则、Apsley诉波音案比率以及Cohen's h系数等指标作为示例。
具有实际意义的措施
影响比率指弱势群体达标率除以优势群体达标率。80%是评估影响比率的基准线。例如,若白人通过率为90%,西班牙裔通过率为85%,则影响比率为94.4%(即85%除以90%)。 即使选拔率差异超过2个标准差,若影响比率高于80%,则表明该差异在实践中不具显著意义。 虽然四分之三规则侧重于筛选率比率,但劳工部合规办公室(OFCCP)在常见问题解答中提及的其他实用显著性指标,采用替代方法评估相同筛选率。例如Cohen's H系数通过统计转换计算优待群体与非优待群体筛选率的差异,从而评估标准化差异。Cohen's h值大于0.80即视为显著差异。2。进阶方法中的比值比与影响比相似,但同时考量目标群体的录用率与拒录率。
根据《大学招生公平准则》(UGESP),翻转规则旨在检验增选一名不受青睐群体成员(同时减少一名受青睐群体成员)所产生的结果。以上述案例为例,假设增选一名西班牙裔申请者并减少一名白人申请者后,最终录取比例变为西班牙裔占90%、白人占85%。此时西班牙裔群体获得优待,而翻转规则表明原有差异在实际层面并不显著。 虽然UGESP在描述翻转规则时特别强调了受惠群体发生变化的情形,但法院通过考量实际需要多少名不受惠群体成员才能使差异降至统计显著性阈值以下,进一步拓展了该概念。法院裁定:当选取少量(具体数量因裁决而异)不受惠群体成员导致差异不具统计显著性时,显著差异在实践中并不具有实质意义。3。
阿普斯利诉波音案比例系指某项具体法院裁决中确立的特定实际意义衡量标准。该案涉及精神航空公司在重新雇佣员工时存在年龄歧视的指控。 精神航空收购多家波音设施后,解雇了所有波音员工,随后从被解雇员工中选拔人员填补收购设施的岗位。尽管选拔缺口(即实际选拔的年长员工数量与根据选拔池构成预期选拔数量之间的差值)在统计学上具有显著性,但年长员工的整体选拔率高达99%。 换言之,尽管雇主选拔的受保护群体成员(本案中即年长员工)数量远低于中立选拔流程预期值,但法院考量到99%的整体选拔率(即受保护群体预期人数的99%),裁定该差异在实践中不具实质意义。
建议
鉴于联邦合同合规计划办公室(OFCCP)近期发布的常见问题解答、社会科学领域的建议以及法院判决均强调同时衡量统计显著性与实际显著性的重要性,雇主理应遵循这一原则。 尽管某些实际衡量标准对雇主而言可能较为陌生,但雇主应优先考虑采用最易计算和解读的指标,即五分之四规则、实际短缺量,以及为使差异降至统计显著性阈值以下所需额外选拔的弱势群体人数。 当实际影响与统计影响的评估结果均显示存在显著差异时,联邦合约合规计划办公室、其他执法机构或原告律师将更有力地指控雇佣歧视。若两类评估结果存在分歧,雇主应寻找歧视的轶事证据,并持续密切监控相关雇佣实践。
1. 雅各布斯、墨菲、席尔瓦(2012)。《平等就业机会执法政策的意外后果:大公司比坏公司更糟糕》。《商业心理学杂志》。在线出版。
2. 科恩,J.(1988)。《行为科学统计功效分析》。劳伦斯·厄尔鲍姆联合出版社。纽约。
3. 美国诉弗吉尼亚州案(1978)620 F.2d 1018;韦索姆诉纽约新泽西港务局案(1991)948 F.2d 1370。
编者按:本文最初发表于 Circaworks.com。2023 年 4 月,Mitratech 收购了包容性招聘和 OFCCP 合规软件的领先供应商 Circa。此后,我们对内容进行了更新,以反映我们扩大的产品范围、不断发展的人才招聘合规法规以及人力资源管理的最佳实践。