Definir el impacto adverso: Amplíe su comprensión

Profundizar en los aspectos funcionales del impacto adverso. Conozca sus implicaciones en las diversas prácticas de contratación y estrategias para un empleo equitativo.

Personal de Mitratech 5 de diciembre de 2019

Resumen
Es difícil encontrar un tema en el mundo de la igualdad de oportunidades en el empleo y la acción afirmativa que sea más impopular que el impacto adverso. El análisis del impacto adverso (también conocido como análisis de la relación de impacto o análisis de la disparidad) no solo implica complicados cálculos estadísticos para llegar a sus resultados, sino que estos resultados se utilizan a menudo en investigaciones como base para acusaciones de discriminación. No es de extrañar que los profesionales de recursos humanos a veces eviten, o incluso denostan, esta práctica. Es difícil, a menudo mal entendida y llena de responsabilidades.

A pesar de estos retos, el análisis del impacto adverso es una herramienta de diagnóstico muy útil para evaluar las prácticas laborales y ayudar a garantizar que el trato justo sea la norma en el trabajo. Del mismo modo que casi cualquier persona puede navegar por Internet sin saber nada de programación, comprender el funcionamiento del impacto adverso es más fácil de lo que muchos creen. Los programas informáticos facilitan los cálculos y los conceptos básicos no son excesivamente complejos. El objetivo de este artículo es desmitificar el impacto adverso y presentar una comprensión concisa de sus conceptos.

Definición de impacto adverso
Tal y como se utiliza hoy en día, el término «impacto adverso» (AI) significa esencialmente lo mismo que cuando se acuñó por primera vez: una tasa de selección sustancialmente diferente en la contratación, la promoción u otras decisiones laborales que perjudica a los miembros de una raza, sexo o grupo étnico (Preguntas y respuestas sobre las directrices uniformes n.º 10).^[i] En esencia, el AI indica si las decisiones tomadas con respecto a un grupo protegido lo dejaron en una situación de desventaja sustancial. Cabe señalar que el impacto adverso simplemente describe las diferencias entre los grupos en un proceso de evaluación. No es un término legal que implique culpa, ni es un término psicométrico que implique injusticia o sesgo en la evaluación.

Los tres métodos más comunes para determinar el impacto adverso son la regla del 80 %, las pruebas de significación estadística y las pruebas de significación práctica. Si bien la regla del 80 % y las pruebas de significación práctica tienen sus ventajas^[ii], los procedimientos de cumplimiento normativo y las batallas legales modernas se libran principalmente en el frente de la «significación estadística».

Esta deferencia hacia un marco normativo/jurídico también influye en las decisiones relacionadas. Tanto las estadísticas descriptivas como las pruebas de significación estadística pueden aplicarse a los análisis de impacto adverso, aunque se prefieren estas últimas. Las estadísticas descriptivas solo muestran la diferencia matemática relevante para la comparación que se está realizando. Las pruebas de significación estadística son más relevantes para los análisis de impacto adverso porque indican si la estadística descriptiva es estadísticamente significativa y si puede considerarse una ocurrencia «más allá de la casualidad».

Los distintos enfoques sobre el impacto adverso suelen dividirse en dos tipos principales: comparaciones de disponibilidad y comparaciones de tasas de selección. Las comparaciones de disponibilidad pueden ser muy útiles para determinar si un grupo puede estar infrautilizado, pero se necesitan más detalles para concluir que existe un impacto adverso. La comparación de tasas de selección es el único tipo de análisis que por sí solo puede demostrar el impacto adverso. Por este motivo, este artículo se centrará en el impacto adverso indicado por las comparaciones de tasas de selección.

Comparaciones de tasas de selección

Una comparación de tasas de selección evalúa las tasas de selección entre dos grupos (por ejemplo, mujeres y hombres, minorías y blancos) en un procedimiento de selección. Las comparaciones de tasas de selección se utilizan con mayor frecuencia en litigios, ya que se refieren específicamente al tipo de análisis de impacto adverso que exigen las Directrices Uniformes. Estos análisis pueden utilizarse para evaluar un solo evento o varios eventos, pero hay que tener especial cuidado al combinar varios eventos (como se explica más adelante). Hay cuatro variables que se introducen en cualquier análisis de impacto adverso de este tipo:

El número de miembros seleccionados para el grupo focal (por ejemplo, mujeres contratadas).
El número de miembros del grupo focal no seleccionados (por ejemplo, mujeres no contratadas).
El número de miembros del grupo de referencia seleccionados (por ejemplo, hombres contratados).
El número de miembros del grupo de referencia no seleccionados (por ejemplo, hombres no contratados).

Comparación de la tasa de selección para un solo evento

La comparación de tasas de selección en un solo evento es el tipo más habitual de análisis de impacto adverso, y se explica específicamente en las Directrices Uniformes como una «comparación de tasas» (Sección 4D) que compara las tasas de aprobación entre dos grupos (por ejemplo, hombres y mujeres) en un procedimiento de selección. Este tipo de análisis también se puede utilizar para analizar el resultado de despidos, descensos de categoría u otras transacciones de personal similares en las que solo hay dos resultados posibles (por ejemplo, ascendido/no ascendido; contratado/no contratado, etc.).

Existen dos categorías de pruebas de significación estadística que pueden utilizarse para analizar el impacto adverso en las comparaciones de tasas de selección: las pruebas exactas y las estimadas. Las pruebas exactas proporcionan el valor preciso de la probabilidad del análisis. Las técnicas estimadas aproximan los resultados exactos sin necesidad de realizar cálculos prolongados. Tanto las técnicas exactas como las estimadas requieren el uso de una tabla de contingencia 2 x 2, como se muestra en la tabla 1.

Tabla de contingencia 2 x 2
	Hombres	Mujeres
Pase	50	40
Fracaso	50	50

Tabla 1 2 Xx2 Tabla de contingencia

Comparaciones de tasas de selección para múltiples eventos

También existe una metodología adecuada para comparar las tasas de aprobación de grupos étnicos y de género en varios «eventos» combinados o administraciones de diversas prácticas, procedimientos o pruebas. Esta técnica también puede utilizarse para realizar un análisis global del impacto adverso en varios puestos de trabajo o grupos de puestos con conjuntos de habilidades similares, o para comparar las tasas de aprobación de grupos en un proceso global de selección o promoción durante varios años. Es necesario realizar una comparación de las tasas de selección de múltiples eventos cuando se incluyen varios años o pruebas en un análisis combinado. Esto se debe a que pueden producirse anomalías estadísticas al combinar datos de múltiples estratos.

Aunque puede resultar tentador simplemente agregar varios años de una práctica de pruebas concreta en un análisis combinado del impacto adverso, los resultados pueden resultar engañosos en ocasiones, a menos que se utilice una técnica especial denominada «eventos múltiples». Un fenómeno estadístico denominado «paradoja de Simpson»^[iii] muestra por qué esto puede ser un problema. Obsérvese en la tabla 2 que, aunque las tasas de selección de cada grupo coinciden en un año determinado, los datos combinados muestran una disparidad del 9 % en las tasas de selección.

Ejemplo de la paradoja de Simpson
Año de prueba	Grupo	# Solicitantes	# Seleccionado	Tasa de selección %
Prueba de 2017	Hombres	400	200	50.0%
Prueba de 2017	Mujeres	100	50	50.0%
Prueba de 2018	Hombres	100	50	20.0%
Prueba de 2018	Mujeres	100	20	20.0%
2017 + 2018 Pruebas combinadas	Hombres	500	220	44.0%
2017 + 2018 Pruebas combinadas	Mujeres	200	70	35.0%

Tabla 2. Ejemplo de la paradoja de Simpson.

Para evitar errores como la paradoja de Simpson, es necesario seguir dos pasos para agregar correctamente los datos y realizar una comparación de tasas de selección de eventos múltiples:

Evaluar los eventos para determinar la consistencia de los patrones. Se debe determinar si la «tendencia» en las tasas de aprobación de un grupo es consistentemente desfavorable. No es apropiado agregar diferentes «eventos» de datos que muestran a un grupo como favorecido y desfavorecido.
Calcule los resultados de la prueba estadística. Esto permitirá evaluar si se produjo un impacto adverso en el análisis global de todos los eventos combinados utilizando una prueba como la de Mantel-Haenszel^[iv].

Determinación de la significación estadística

Independientemente de cuál de las dos comparaciones de tasas de selección se utilice, el valor resultante sigue requiriendo contexto. Después de todo, ¿qué grado de inesperado debe ser un resultado para considerarse «inusual» o «raro»? ¿En qué momento un tribunal u otra agencia supervisora determinaría que los resultados son ejecutables? Este punto de inflexión conceptual se denomina significación estadística.

Es muy poco probable que los resultados estadísticamente significativos de un proceso de selección o una prueba se produzcan por casualidad. Dicho resultado indica un punto en el que se puede afirmar, con un nivel razonable de certeza, que existe realmente una tendencia legítima y no una relación casual. Las pruebas de significación estadística dan como resultado un valor p (de probabilidad). Los valores p de 0,05 (es decir, el 5 %) o menos se consideran «estadísticamente significativos» en el ámbito de los análisis de IA. En términos prácticos, esto es comparable a seleccionar correctamente una sola carta elegida de una baraja estándar de 52 cartas en no más de 2-3 intentos (2,6 intentos representan una probabilidad del 5 %).

Cuando se realiza una prueba estadística para evaluar si un evento es estadísticamente significativo, siempre hay una «potencia» asociada a la prueba. Esta puede utilizarse para describir su capacidad para revelar un hallazgo estadísticamente significativo, si lo hay. Dicho de otro modo, la «potencia» indica en qué medida se puede confiar en el hallazgo. Hay tres factores que determinan la potencia estadística:

Tamaño del efecto. En las comparaciones de tasas de selección, esto se refiere al tamaño de la «diferencia» entre las tasas de selección de los dos grupos. Una diferencia mayor revela más fácilmente la significación estadística.
Tamaño de la muestra. El número de miembros de cada grupo desempeña un papel fundamental en los análisis de impacto adverso. Al igual que en una encuesta informal, un tamaño de muestra mayor mejora la fiabilidad.
El tipo de prueba estadística utilizada. Esto incluye la fórmula real de los análisis de impacto adverso (algunas pruebas son más potentes que otras) y si se utiliza una prueba de significación unilateral o bilateral (véase más adelante el análisis sobre las pruebas unilaterales frente a las bilaterales).

Los investigadores y profesionales suelen tener poco control sobre las diferencias medidas (es decir, el tamaño del efecto) de los grupos que se analizan. Por lo tanto, reunir una muestra de gran tamaño es quizás la forma más eficaz de aumentar la potencia de un análisis de impacto adverso, lo que aumenta la probabilidad de obtener un resultado estadísticamente significativo. A continuación se presentan al menos cinco formas de lograrlo. Es importante señalar que las cuatro primeras técnicas de agregación requieren el uso de análisis de tipo «eventos múltiples» adecuados, ya que, como se ha mencionado anteriormente, pueden producirse anomalías estadísticas al combinar datos.

Amplíe el plazo.
Combinar varias áreas geográficas.
Combina eventos de varios trabajos, grupos de trabajo o divisiones.
Combinar varios procedimientos de selección.
Combinar diferentes grupos étnicos.

A pesar de años de debate, no existe un umbral absoluto y definitivo en cuanto al tamaño mínimo de la muestra necesario para realizar investigaciones estadísticas. Los tribunales suelen adoptar la postura de que no existe un tamaño mínimo claro para la muestra. Sin embargo, si hubiera que elegir un número mínimo firme para los análisis de impacto adverso, el consenso parece ser 30, con al menos cinco esperados para la selección. Es importante señalar que los análisis estadísticos en los que intervienen números pequeños adolecen de un mayor «error de muestreo», lo que hace que los resultados sean menos fiables que los análisis que utilizan conjuntos de datos más grandes.

A la hora de considerar el tipo de prueba estadística que se va a utilizar, existen pruebas «estimadas» y «exactas». Las pruebas estimadas proporcionan una probabilidad aproximada de una circunstancia. Las segundas, que calculan la probabilidad exacta de una circunstancia, se consideran las pruebas estadísticas más potentes para los cálculos de impacto adverso. Si bien una prueba exacta proporciona un resultado más refinado, una prueba estimada puede aplicarse más fácilmente en algunas situaciones (por ejemplo, cuando el tamaño de la muestra es más pequeño).

Una última metodología a tener en cuenta a la hora de determinar la significación estadística en los análisis de IA es el uso de una prueba unilateral frente a una prueba bilateral. Una prueba estadística unilateral investiga la posibilidad de que se produzca discriminación en una sola dirección (por ejemplo, contra las mujeres). Una prueba bilateral asume que la discriminación podría haber ocurrido en cualquier dirección (por ejemplo, contra los hombres o contra las mujeres) y dedica su poder estadístico a investigar la discriminación en ambas direcciones. Los tribunales han sido casi totalmente coherentes en su exigencia de utilizar una prueba bilateral para determinar la significación.

Reflexiones finales
Los análisis de impacto adverso son complejos por naturaleza y variados en su forma, pero eso no debe disuadir a los profesionales de incluirlos como una opción en su arsenal de herramientas. La información obtenida de los análisis de impacto adverso es excepcionalmente útil para identificar áreas de responsabilidad potencial. También proporcionan una orientación clave para reunir los recursos necesarios para abordar las preocupaciones planteadas. Aunque existen varios recursos disponibles para ayudar con los análisis de impacto adverso, Biddle ha proporcionado una herramienta en línea gratuita para calcular análisis de impacto adverso sencillos en http://www.biddle.com/adverseimpacttoolkit/SelectionRateComparison.aspx.

Realizar análisis de impacto adverso es un paso muy valioso para las organizaciones que investigan sus procesos de selección y limpian aquellas áreas de dichos procesos que pueden no ser equitativas. Sin embargo, para que esto último suceda, hay que reconocer que los análisis de IA son solo indicadores de lo que ha ocurrido. El simple hecho de identificar un problema no lo resolverá; hay que tomar medidas adicionales si se quiere lograr un cambio duradero. Es fundamental interpretar correctamente los resultados de la IA y formular un plan de acción. Por lo tanto, se podría considerar acertadamente que la conclusión de un análisis de impacto adverso es el punto en el que realmente comienza el «trabajo real».

^[i] Las Directrices uniformes sobre los procedimientos de selección de empleados y las preguntas y respuestas relacionadas se pueden consultar en www.uniformguidelines.com.
^[ii] Véase Biddle, D. A. (2011). Adverse Impact and Test Validation: a Practitioner’s Handbook (3.ª ed.). Scottsdale, AZ: Infinity Publishing. (pp. 3-5).
^[iii] Véase Finkelstein, M. O. y Levin, B. (2001), Statistics for Lawyers (2.ª ed.). Nueva York, NY: Springer (p. 237).
^[iv] La técnica de Mantel-Haenszel se desarrolló originalmente para agregar conjuntos de datos para la investigación del cáncer. Véase Mantel, N. y Haenszel, W. (1959), Statistical aspects of the analysis of data from retrospective studies of disease. Journal of National Cancer Institute, 22, 719-748.

Nota del Editor: Este post fue publicado originalmente en Circaworks.com. En abril de 2023, Mitratech adquirió Circa, un proveedor líder de software de reclutamiento inclusivo y cumplimiento de OFCCP. El contenido ha sido actualizado desde entonces para reflejar nuestra oferta ampliada de productos, la evolución de las regulaciones de cumplimiento de adquisición de talento y las mejores prácticas en la gestión de RRHH.

Soluciones sectoriales