À première vue, les données manquantes semblent être plus une nuisance banale qu'un problème. C'est notamment le cas des données relatives à la race et au sexe que les candidats déclarent volontairement. Cependant, d'après notre expérience, les données manquantes constituent l'une des menaces les plus négligées pour la conformité au PAA. Malheureusement, la plupart des entrepreneurs ne s'en rendent compte que lorsqu'ils se trouvent en plein milieu d'un audit de l'OFCCP. L'objectif de cet article est d'aider les entrepreneurs fédéraux à mieux comprendre les données manquantes, en abordant les points suivants :

  1. Qu'est-ce que les données manquantes ?
  2. Conséquences des données manquantes - Analyses AAP/EEO inexactes.
  3. Meilleures pratiques - Comment gérer cette menace.

 

Section 1 : Qu'est-ce que les données manquantes ?

En règle générale, les analystes considèrent les données manquantes comme des informations simplement vides dans un ensemble de données. Dans la pratique, cependant, toutes les données manquantes ne sont pas identiques. Dans AAP/EEO, il existe deux formes de données manquantes :

  1. Manquement au hasard (MAR)
  2. Non manquant au hasard (nMAR)

Disparus au hasard (MAR)

La recherche suggère que les données sont rarement manquantes au hasard. Bien qu'il soit difficile de prouver le contraire, les analystes sont mis en garde contre le fait de supposer que les données manquantes sont des MAR sans procéder à une enquête de base.

En pratique, les données MAR sont celles qui posent le moins de problèmes dans les analyses AAP/EEO. Comme les données manquent de manière aléatoire, il n'y a pas de schéma systémique quant à la manière dont les données manquent et tous les groupes (sexe, race) sont touchés de la même manière. Prenons l'exemple suivant :

Données manquantes Analyse Homme Femme Total
Non Manquant Nombre (#) 70 30 100
Pct (%) 70% 30%
MAR Nombre (#) 35 15 50
Pct (%) 70% 30%

Lorsqu'il n'y a pas de données manquantes, nous constatons qu'il y a 100 candidats au total, dont 70 hommes (70 %) et 30 femmes (30 %). Lorsque les données manquent de manière aléatoire, l'impact est le même sur les candidats masculins et féminins. Nous constatons que les données MAR sont composées de 70 % de candidats masculins et de 30 % de candidats féminins.

Comme le montre cet exemple, la principale conséquence des données MAR est la réduction de la taille de l'échantillon. D'un point de vue analytique, la réduction de la taille de l'échantillon diminue la puissance statistique. Les praticiens orientés vers la défense peuvent se réjouir de l'incapacité d'une analyse ou de l'OFCCP à détecter l'importance, mais c'est une vision à court terme et une erreur. La section 2 aborde ce problème plus en détail.

Non manquant au hasard (nMAR)

À des degrés divers, il existe des schémas systémiques de données manquantes dans le monde réel. Les données manquantes peuvent entraîner des biais et fausser les analyses de manière imprévisible. Par exemple, les candidats afro-américains peuvent être enclins à ne pas divulguer volontairement leur race parce qu'ils craignent qu'elle soit liée d'une manière ou d'une autre à leur candidature.

Cela n'est pas surprenant, surtout si l'on considère les recherches sur les candidats issus de minorités qui ressentent le besoin de blanchir leur CV. À l'inverse, les candidats blancs peuvent ne pas divulguer volontairement leur race, étant donné l'importance accordée à la diversification de la main-d'œuvre. En fonction de l'emploi et du climat social, le nMAR peut prendre différentes formes - la direction de cet impact systémique est imprévisible. Dans l'ensemble, les informations manquantes sur les candidats sont très probablement des données nMAR à des degrés divers.

Il est évident que les données nMAR peuvent avoir de graves conséquences dans les situations d'audit. La section suivante détaille trois (3) menaces que les données MAR et nMAR font peser sur la validité de l'analyse.

Section 2 : Analyses AAP/EEO inexactes

Les chercheurs connaissent depuis longtemps le problème des données manquantes. Elles peuvent biaiser artificiellement les analyses, ce qui entraîne des résultats et des conclusions trompeurs. Pour les entrepreneurs, ces effets peuvent attirer inutilement l'attention et l'examen de l'OFCCP. Lorsqu'il manque des données sur les candidats, voici trois (3) problèmes courants qu'un entrepreneur peut rencontrer :

  1. Analyse artificiellement significative
  2. Analyse artificiellement non significative
  3. Des candidats à l'embauche en tête-à-tête

Problème 1 : Analyse artificiellement significative

L'impact négatif significatif, la sous-utilisation et les lacunes sont des points douloureux majeurs pour les contractants en situation d'audit. Dans l'exemple suivant, les données sur les candidats souffrent d'un nMAR qui affecte les candidats masculins. Lorsqu'aucune donnée n'est manquante, le taux de sélection des candidats masculins et féminins est le même (70 %).

Cependant, lorsqu'il existe un modèle systémique de données manquantes concernant les candidats masculins, nous ne sommes en mesure d'identifier que 12 candidats masculins qui n'ont pas été embauchés ; les 18 candidats masculins restants sont inconnus. Par conséquent, lors d'un audit, le taux de sélection observé pour les hommes (85 %) est significativement plus élevé que pour les femmes (70 %), (écart-type = 2,00).

Données manquantes Groupe Statut de l'employé Statistiques
Std. Dev.
Oui Non
Non Manquant Homme 70 30 0.00
Femme 35 15
nMAR Homme 70 12 2.00
Femme 35 15

Remarque : dans le cadre des bonnes pratiques, il est possible d'identifier les données démographiques de la quasi-totalité des candidats inconnus qui sont embauchés.

Il est clair que ce résultat statistiquement significatif est artificiel et entièrement dû au problème des données nMAR affectant les candidats masculins.

Problème 2 : Analyse de l'utilisation artificiellement non significative

D'autre part, le nMAR peut conduire à des résultats non significatifs d'un point de vue statistique. Cela peut être dû à deux effets : 1) une modification du taux de sélection et/ou 2) une diminution de la puissance statistique pour détecter la signification. Si les praticiens orientés vers la défense peuvent se réjouir, il s'agit, comme nous l'avons suggéré plus haut, d'une vision à court terme. Prenons l'exemple suivant où le nMAR affecte les candidates :

Données manquantes Groupe Statut de l'employé Statistiques
Std. Dev.
Oui Non
Non Manquant Homme 70 30 4.60
Femme 15 35
nMAR Homme 70 30 1.95
Femme 15 15

Remarque : dans le cadre des bonnes pratiques, il est possible d'identifier les données démographiques de la quasi-totalité des candidats inconnus qui sont embauchés.

Lorsqu'aucune donnée n'est manquante, le taux de sélection des candidats masculins (70 %) est significativement plus élevé que celui des candidates féminines (30 %), (écart-type = 4,60). Cependant, lorsqu'il existe un modèle systémique de données manquantes affectant les candidates, nous ne sommes en mesure d'identifier que 15 candidates qui n'ont pas été recrutées ; les 20 autres candidates sont inconnues. Par conséquent, le taux de sélection observé pour les hommes (70 %) n'est pas significativement plus élevé que celui des femmes (50 %), (écart-type = 1,95).

Si ces résultats étaient obtenus dans le cadre d'un PAA annuel, le contractant ignorerait ce groupe d'emplois particulier. Toutefois, dans le cadre d'un audit, l'affinement et le nettoyage des données ont permis de récupérer une candidate supplémentaire (non embauchée). Dans ce cas, avec l'ajout d'une seule candidate, le contractant se rend compte beaucoup trop tard que le taux de sélection des femmes est nettement inférieur à celui des hommes. En fait, tout effort de nettoyage des données pour récupérer des données ne servirait qu'à amplifier ou à aggraver la situation, car l'effet nMAR est en défaveur des candidatures féminines, puisque seul le nombre de femmes non embauchées augmenterait.

Données manquantes Groupe Statut de l'employé Statistiques
Std. Dev.
Oui Non
nMAR Homme 70 30 2.13
Femme 15 16

Problème 3 : Des candidats à l'embauche en tête-à-tête

Il n'est pas rare que les entrepreneurs constatent qu'ils ont embauché des personnes mais qu'ils n'ont pas de données sur les candidats. Dans certains cas, les données relatives aux candidats n'ont pas été saisies, mais dans la plupart des cas, le nombre de candidats était faible et personne n'a volontairement fourni ses informations démographiques. Dans de tels cas, les contractants ne peuvent que "récupérer" les enregistrements de données relatives aux candidats. En pratique, cela signifie qu'ils ne peuvent récupérer que les données démographiques des personnes qui ont été embauchées. Voici un bon exemple :

Données manquantes Groupe Statut de l'employé Statistiques
Std. Dev.
Oui Non
Non Manquant Homme 2 0 1.98
Femme 0 5
nMAR Homme 2 0 0.00
Femme 0 0

Remarque : dans le cadre des bonnes pratiques, il est possible d'identifier les données démographiques de la quasi-totalité des candidats inconnus qui sont embauchés.

Dans cet exemple, il y a eu deux recrutements d'hommes et aucun de femmes. Si 100 % des données sur les candidats sont manquantes, il est possible de "récupérer" deux (2) candidats masculins, simplement parce qu'ils ont été embauchés et que toutes leurs données démographiques sont disponibles dans le fichier de données sur les salariés. Quant aux cinq (5) candidates, elles sont irrécupérables car elles n'ont pas été embauchées et ne figurent pas dans le fichier des employés. Par conséquent, les analyses candidats-embauchés sont qualifiées d'embauches "une à une" - toutes les personnes qui ont postulé ont été embauchées.

Dans la pratique, l'OFCCP est assez compréhensif à l'égard des difficultés rencontrées par les entrepreneurs pour recueillir des données de qualité sur les candidats. Toutefois, si les recrutements individuels sont excessifs, ils se démarqueront facilement et feront l'objet d'un examen minutieux de la part de l'OFCCP.

Section 3 : Meilleures pratiques

Il faut s'attendre à ce que des informations manquent dans les données relatives aux candidats, car la divulgation de la race, du sexe et d'autres données démographiques est volontaire. Par conséquent, les entrepreneurs ne peuvent que s'efforcer de veiller à ce que les données relatives aux candidats soient aussi complètes que possible. Voici deux bonnes pratiques pour les entrepreneurs :

  1. Demander aux candidats de sélectionner "Je choisis de ne pas divulguer" s'ils ne souhaitent pas s'auto-identifier.
  2. "Récupérer les données démographiques des dossiers des employés parmi les personnes embauchées.

Exiger des candidats qu'ils choisissent

Bien qu'il ne soit pas possible d'obliger les candidats à divulguer leur race et leur sexe, il est possible d'enregistrer correctement leur refus de s'identifier. Une bonne pratique consiste à demander aux candidats de choisir une catégorie de race ou de sexe, ou de dire "Je choisis de ne pas divulguer". Cette configuration du système de suivi des candidats (ATS) présente deux avantages importants :

    1. Si le candidat refuse de sélectionner l'une des options disponibles (y compris "Je choisis de ne pas divulguer"), il ne peut pas aller de l'avant et ne peut techniquement pas compléter la candidature, ce qui l'exclut du processus de sélection. Cela permet d'éliminer les données manquantes et de saisir correctement les personnes qui refusent de s'identifier comme "Je choisis de ne pas divulguer".

 

  1. Cette méthode permet de documenter les efforts déployés par le contractant pour recueillir les données démographiques des demandeurs. Avec une documentation appropriée, le risque de violation de la conformité liée à des données manquantes dans une situation d'audit est considérablement réduit. Malheureusement, de nombreux contractants se contentent d'accords de conciliation parce qu'ils ne disposent pas de la documentation nécessaire pour expliquer correctement le nombre extraordinairement élevé de demandeurs dont les données démographiques sont manquantes.

Récupérer les informations sur le demandeur

Dans certains cas, les informations manquantes sur les candidats peuvent être récupérées. Un candidat peut choisir de ne pas s'identifier pendant la phase de candidature, mais une fois qu'il devient employé, il est (pour la plupart) tenu de divulguer ses données démographiques (par exemple, sa race et son sexe). Si un candidat refuse de s'identifier au cours de la procédure de candidature, mais qu'il est embauché, il est acceptable de mettre à jour les données du candidat avec des informations provenant de son dossier d'employé (par exemple, la race et le sexe). Cela peut avoir un impact significatif sur les résultats globaux, en particulier si un grand nombre de candidats inconnus sont embauchés.

Résumé et conclusion

Pour la plupart des entrepreneurs, les données manquantes sont loin d'être anodines. Nous espérons que cet article contribuera à sensibiliser les entrepreneurs et à les aider à mieux comprendre les données manquantes. Tout d'abord, les données manquantes ne sont pas toutes identiques. Certaines sont considérées comme manquantes au hasard (MAR) et d'autres comme non manquantes au hasard (nMAR). Dans la pratique, les données manquantes sont généralement des données non manquantes au hasard, ce qui peut fausser les données et entraîner des résultats analytiques peu fiables. Lorsque les données manquantes sont importantes, le phénomène des recrutements "un pour un" est inévitable, ce qui peut attirer l'attention de l'OFCCP sur le manque de fiabilité des données. En fin de compte, les informations démographiques sur les candidats ne sont pas obligatoires et l'OFCCP le comprend. Les contractants doivent simplement documenter leur processus, de sorte qu'il est clair que des efforts appropriés ont été déployés pour permettre aux candidats de s'auto-identifier. Les chercheurs se débattent avec les données manquantes depuis de très nombreuses années. Il n'y a pas de réponse facile. Nous espérons que cet article contribuera à mettre en lumière un problème souvent négligé, mais grave, dont de nombreux entrepreneurs ne sont pas conscients.

Pour plus d'informations sur les données manquantes et l'assistance générale AAP/EEO, n'hésitez pas à contacter Biddle Consulting Group, Inc. en envoyant un courriel à [email protected] ou en appelant le 800-999-0438.

Note de l'éditeur : Cet article a été publié à l'origine sur Circaworks.com. En avril 2023, Mitratech a acquis Circa, un fournisseur de premier plan de logiciels de recrutement inclusif et de conformité OFCCP. Le contenu a depuis été mis à jour pour refléter l'élargissement de nos offres de produits, l'évolution des réglementations de conformité en matière d'acquisition de talents et les meilleures pratiques en matière de gestion des ressources humaines.