Einführung

Jedes Jahr führen die Equal Employment Opportunity Commission (EEOC), das US-Justizministerium, das Office of Federal Contract Compliance Programs (OFCCP) oder von privaten Anwälten vertretene Kläger Rechtsstreitigkeiten gemäß Titel VII des Civil Rights Act von 1964. Viele dieser Fälle betreffen Praktiken, Verfahren oder Tests (PPT), die bei der Einstellung und Beförderung von Mitarbeitern zum Einsatz kommen. Unternehmen müssen mit hohen Verlusten rechnen, nicht nur in finanzieller Hinsicht, sondern auch in rechtlicher Hinsicht und in Bezug auf ihren Ruf. Der Rechtsstreit könnte dazu führen, dass der diskriminierten Gruppe Lohn und Zinsen zurückgezahlt werden müssen oder dass das Gericht beginnt, die Praktiken, Verfahren oder Tests des Arbeitgebers bei der Einstellung oder Beförderung sorgfältig zu überwachen. Diese Kosten und Eingriffe beinhalten nicht die verlorene Zeit oder die Kosten, die dem Unternehmen entstehen, wenn es die Praktiken, Verfahren oder Tests selbst entwickelt oder eine externe Firma damit beauftragt hat. Wenn Bewerber außerdem viel Zeit für die Vorbereitung auf einen Test aufwenden mussten und die Testergebnisse wegen mangelnder rechtlicher Vertretbarkeit verworfen wurden, hat das Unternehmen Zeit verschwendet. Dieser Artikel erläutert einen aktuellen Rechtsstreit wegen ungleicher Auswirkungen und Testvalidierung, den Prozessverlauf und Dinge, die ein Unternehmen bei der Entwicklung von Praktiken, Verfahren oder Tests für Einstellungs- und Beförderungszwecke berücksichtigen sollte.

Die jüngste Klage wegen ungleicher Auswirkungen und Testgültigkeit

Am 16. November 2015 wurde ein Gerichtsurteil in einem Fall gefällt, in dem zehn afroamerikanische Polizeisergeants, die beim Boston Police Department (BPD) beschäftigt waren, die Stadt Boston gemäß Titel VII des Civil Rights Act von 1964 verklagt hatten (Smith v. City of Boston, 2015). 1. Die Kläger behaupteten, dass die Multiple-Choice-Prüfung, die das BPD 2008 zur Auswahl von Sergeants für die Beförderung zum Lieutenant durchgeführt hatte, unterschiedliche Auswirkungen auf Kandidaten aus Minderheiten hatte und nicht ausreichend mit der Position in Zusammenhang stand, um einer Anfechtung standzuhalten. Die Stadt behauptete, dass die Prüfung keine ungleichen Auswirkungen auf Kandidaten aus Minderheiten habe und dass sie, selbst wenn dies der Fall wäre, ausreichend gültig sei, um einer Anfechtung gemäß Titel VII standzuhalten. Die Prüfung in diesem Fall bestand aus zwei Teilen: einer schriftlichen Prüfung ohne Hilfsmittel mit 100 Multiple-Choice-Fragen und einer Bewertung der Ausbildung und Erfahrung (E&E).

Art dieses Falles mit ungleicher Auswirkung

Das Ziel von Titel VII ist es, „dass der Arbeitsplatz ein Umfeld ohne Diskriminierung ist, in dem die ethnische Zugehörigkeit kein Hindernis für Chancengleichheit darstellt“ (Ricci v. DeStefano, 2009).2. Das Gesetz soll „die Einstellung von Mitarbeitern auf der Grundlage ihrer beruflichen Qualifikationen und nicht aufgrund ihrer ethnischen Zugehörigkeit oder Hautfarbe fördern“ (Griggs v. Duke Power, 1971). 3. Es gibt zwei Arten von Diskriminierung am Arbeitsplatz gemäß Titel VII: Ungleichbehandlung und ungleiche Auswirkungen. Bei einer Klage wegen Ungleichbehandlung wird einem Arbeitgeber vorgeworfen, absichtlich Beschäftigungsentscheidungen auf der Grundlage von nicht berufsbezogenen Gründen wie der Rasse getroffen zu haben. Eine Klage wegen ungleicher Auswirkungen richtet sich gegen eine Beschäftigungsentscheidung, die zwar keine Diskriminierungsabsicht zu haben scheint, aber dennoch zu weniger günstigen Ergebnissen für Angehörige einer geschützten Gruppe führt.

Der hier untersuchte Fall ist ein Fall mit ungleicher Auswirkung. Fälle mit ungleicher Auswirkung bei Einstellungen und Beförderungen folgen den Richtlinien der bundesstaatlichen Uniform Guidelines on Employee Selection Procedures (Einheitliche Richtlinien für Mitarbeiterauswahlverfahren, 1978)4. Die Uniform Guidelines wurden 1978 entwickelt, um einen Standard für die Entwicklung und Validierung von PPTs festzulegen und den Gerichten als Leitfaden für die Verhandlung von Fällen mit ungleicher Auswirkung bei Auswahl-, Beförderungs- oder anderen Beschäftigungsentscheidungen zu dienen. Die Einheitlichen Richtlinien definieren ungleiche Auswirkungen als „eine erheblich unterschiedliche Auswahlquote bei der Einstellung, Beförderung oder anderen Beschäftigungsentscheidungen, die Mitglieder einer Rasse, eines Geschlechts oder einer ethnischen Gruppe benachteiligt”. Wenn ungleiche Auswirkungen vorliegen, muss das Gericht als nächsten Schritt feststellen, ob das PPT arbeitsbezogen ist. Gültige PPTs können ungleiche Auswirkungen auf eine geschützte Gruppe wie Frauen oder Minderheiten haben und dennoch nicht rechtswidrig diskriminierend sein.

Gemäß den einheitlichen Richtlinien liegt eine rechtswidrige Beschäftigungspraxis aufgrund ungleicher Auswirkungen nur dann vor, wenn der Kläger (in der Regel ein Bewerber, der nicht eingestellt wurde) nachweist, dass der Beklagte (in der Regel der Arbeitgeber) eine Beschäftigungspraxis aufgrund von Rasse, Hautfarbe, Religion, Geschlecht oder nationaler Herkunft angewendet hat, die eine ungleiche Auswirkung auf den Kläger hatte, und der Beklagte nicht nachweisen konnte, dass die beanstandete Praxis, das Verfahren oder der Test mit der Stelle, auf die sich der Kläger beworben hatte, in Zusammenhang stand. Wenn der Kläger hingegen eine alternative Beschäftigungspraxis vorschlägt, die dem Arbeitgeber und dem Beklagten gleichermaßen zugute kommt und keine Ungleichbehandlung darstellt, der Beklagte sich jedoch weigert, die alternative Beschäftigungspraxis zu übernehmen, wird der Kläger obsiegen. Der Kläger muss zunächst Beweise vorlegen, um einen Fall von Diskriminierung aufgrund ungleicher Auswirkungen nachzuweisen, indem er zunächst eine bestimmte Beschäftigungspraxis identifiziert. In diesem Fall war die bestimmte Beschäftigungspraxis der Beförderungstest von 2008. Wenn der Kläger einen ersten Fall von Diskriminierung nachweisen kann, kann der Beklagte (in diesem Fall der Arbeitgeber) entweder den ersten Fall von Diskriminierung durch ungleiche Behandlung des Klägers widerlegen oder nachweisen, dass die Beschäftigungspraxis, selbst wenn eine Diskriminierung durch ungleiche Auswirkungen vorliegt, „arbeitsplatzbezogen und mit den geschäftlichen Erfordernissen vereinbar“ ist. Der Kläger kann den Fall jedoch dennoch gewinnen, wenn er nachweisen kann, dass eine andere Beschäftigungspraxis verfügbar war, die den Interessen des Arbeitgebers ebenso gut gedient hätte und weniger unterschiedliche Auswirkungen gehabt hätte.

Gerichtsurteil zu ungleicher Auswirkung

Da die Kläger behaupteten, dass die von der BPD im Jahr 2008 zur Auswahl von Sergeants für die Beförderung zum Leutnant durchgeführte Multiple-Choice-Prüfung unterschiedliche Auswirkungen auf Bewerber aus Minderheiten hatte und nicht ausreichend mit der Position in Zusammenhang stand, um einer Anfechtung standzuhalten, musste in diesem Fall zunächst festgestellt werden, ob die Prüfung von 2008 unterschiedliche Auswirkungen auf Bewerber aus Minderheiten hatte.

Wie eine Feststellung einer ungleichen Auswirkung normalerweise getroffen wird

Häufig, wie auch in diesem Fall, stützen sich Gerichtsverfahren stark auf Sachverständigenaussagen. Der Sachverständige des Beklagten versuchte, statistische Beweise dafür zu liefern, dass keine ungleichen Auswirkungen vorlagen und dass der Test gültig war, während der Sachverständige des Klägers argumentierte, dass es ausreichende statistische Beweise für ungleiche Auswirkungen gab und der Test nicht gültig war. Sachverständige der Kläger- und der Beklagtenseite prüften Berichte über die Testentwicklung, die Ergebnisse und die Beförderungsquoten bei der Verwendung des Tests von 2008 und legten ihre Analyse der Ergebnisse und Sachverständigenaussagen vor. Beide Parteien waren sich einig, dass Testteilnehmer aus Minderheiten den Test von 2008 bestanden hatten und im Vergleich zu weißen Kandidaten seltener zum Leutnant befördert wurden. Eine geringere Beförderungsquote allein reicht jedoch nicht aus, um eine Entscheidung wegen ungleicher Auswirkungen zu treffen. Es muss ein ausreichend großer statistischer Unterschied in den Beförderungsquoten zwischen den beiden Gruppen bestehen, um nachzuweisen, dass die Unterschiede nicht nur zufällig zustande gekommen sind.

Zwei Arten von Messungen können verwendet werden, um unterschiedliche Auswirkungen nachzuweisen: Tests zur statistischen Signifikanz und die 4/5-Regel. Statistische Signifikanz kann in Fällen wie diesem einen Nachweis dafür darstellen, dass die Wahrscheinlichkeit, dass die Kandidaten aus Minderheiten allein aufgrund des Zufalls im Auswahlverfahren schlechter abschneiden, weniger als fünf Prozent betrug. Dies wird durch einen statistischen Test gezeigt, der belegt, dass der p-Wert (Wahrscheinlichkeitswert) unter 0,05 liegt, was bedeutet, dass die Wahrscheinlichkeit, dass das Ergebnis zufällig zustande gekommen ist, weniger als fünf von 100 beträgt. Die 4/5-Regel besagt, dass, wenn die Auswahlquote für eine ethnische Gruppe weniger als 4/5 (80 Prozent) der Auswahlquote der Gruppe mit der höchsten Quote beträgt, ein Hinweis auf eine ungleiche Auswirkung vorliegt. Die 4/5-Regel wird oft als Maßstab angesehen, ist jedoch nicht der einzige Maßstab von praktischer Bedeutung. Die praktische Bedeutung geht über die statistische Signifikanz hinaus, indem sie untersucht, ob das Ausmaß der Unterschiede in den Auswahlquoten zwischen Angehörigen von Minderheiten und Mehrheitsgruppen von Bedeutung ist.

Das folgende Beispiel veranschaulicht die Berechnung nach der 4/5-Regel. Wenn es 100 weiße Bewerber und 100 afroamerikanische Bewerber gibt und 60 weiße Bewerber eine Stelle angeboten bekommen und diese annehmen und 40 afroamerikanische Bewerber eine Stelle angeboten bekommen und diese annehmen, beträgt die Auswahlquote für Weiße 60 Prozent (60/100) und die Auswahlquote für Afroamerikaner 40 Prozent. Wenn man das Auswahlverhältnis von 40 Prozent für Afroamerikaner durch das Auswahlverhältnis von 60 Prozent für Weiße teilt, ergibt sich ein Ergebnis von 66,66 Prozent oder 2/3. Da das Auswahlverhältnis für Afroamerikaner weniger als 4/5 des Auswahlverhältnisses für Weiße beträgt, verstößt das Verhältnis der eingestellten Weißen zu den eingestellten Afroamerikanern gegen die 4/5-Regel.

bq lquo Die Wahrscheinlichkeit, statistisch signifikante Unterschiede zu finden, steigt mit der Anzahl der Personen, die an Rechtsstreitigkeiten wegen ungleicher Auswirkungen beteiligt sind. bq rquo

Andere Faktoren können die Art und Weise beeinflussen, wie praktische Signifikanz und statistische Signifikanz von den Gerichten bei der Feststellung einer ungleichen Auswirkung bewertet werden. Die Wahrscheinlichkeit, statistisch signifikante Unterschiede festzustellen, steigt mit der Anzahl der Personen, die an einem Rechtsstreit wegen ungleicher Auswirkung beteiligt sind. Umgekehrt wird es schwieriger, statistisch signifikante Unterschiede zwischen Gruppen festzustellen, wenn die Stichprobengröße abnimmt. Daher gewinnen praktische Signifikanzmaße an Bedeutung, wenn die Stichprobengröße sehr groß oder sehr klein ist. Die einheitlichen Richtlinien weisen auf die Verwendung der praktischen Signifikanz als „Faustregel” hin, geben jedoch keine klaren Leitlinien dafür, wie die praktische Signifikanz gegenüber statistischen Signifikanzmaßstäben bei der Entscheidung über ungleiche Auswirkungen abzuwägen ist. In jedem Gerichtsverfahren werden statistische Signifikanz- und praktische Signifikanzmaßstäbe geprüft, wenn über ungleiche Auswirkungen entschieden wird.

Nehmen wir als Beispiel eine Situation, in der Afroamerikaner seltener eingestellt wurden als Weiße, aber insgesamt nur wenige Bewerber eingestellt wurden. Ein Verteidiger könnte versuchen zu zeigen, dass die Unterschiede in den Einstellungsquoten statistisch nicht signifikant wären, wenn nur zwei weitere Afroamerikaner eingestellt worden wären. Das Gericht könnte dann entscheiden, dass die Unterschiede praktisch nicht signifikant waren und dass keine ungleichen Auswirkungen auftraten. Dies wäre ein Beispiel dafür, dass die Unterschiede in den Auswahlquoten so gering sind, dass bei einer erneuten Durchführung desselben Auswahlverfahrens möglicherweise gar keine ungleichen Auswirkungen auftreten würden.

Eine von Clavette (2010)5 durchgeführte Forschungsstudie kann dabei helfen zu verstehen, wie häufig praktische und statistische Signifikanzmaße von Gerichten bei der Entscheidung über eine Ungleichbehandlung herangezogen werden. Clavette untersuchte 29 Gerichtsverfahren zu Ungleichbehandlung aus den Jahren 1974 bis 2009, um zu beurteilen, wie häufig praktische und statistische Signifikanzmaße zur Feststellung von Ungleichheiten verwendet wurden. Von den 29 Fällen wurden in 11 Fällen nur praktische Signifikanzmaße zur Feststellung ungleicher Auswirkungen herangezogen. Davon konnten in sechs Fällen (oder etwa 55 Prozent) Ungleichheiten nachgewiesen werden. In drei Fällen wurden nur statistische Signifikanztests als Maß für Ungleichheiten herangezogen, und davon konnten in zwei Fällen (oder etwa 66 Prozent) Ungleichheiten nachgewiesen werden. In den übrigen 15 Fällen wurden sowohl praktische als auch statistische Maße herangezogen. In elf (oder etwa 73 Prozent) dieser Fälle wurden signifikante Ungleichheiten nachgewiesen. Es besteht keine Verpflichtung, sowohl praktische als auch statistische Messungen durchzuführen. Es scheint jedoch, dass bei Verwendung sowohl statistischer als auch praktischer Messungen mehr Ungleichheiten festgestellt werden.

Feststellung einer ungleichen Auswirkung bei der Durchführung der BPD-Prüfung

Diese Grundsätze zur Feststellung einer ungleichen Auswirkung wurden herangezogen, um zu beurteilen, ob im Fall der BPD-Prüfung eine ungleiche Auswirkung vorlag. Das Gericht bewertete vier Kennzahlen (Beförderungsquoten, bestandene Prüfungsergebnisse, durchschnittliche Prüfungsergebnisse und Verzögerungen bei Beförderungen), um festzustellen, ob eine ungleiche Auswirkung vorlag. Die durchschnittlichen Prüfungsergebnisse und die durchschnittlichen Verzögerungen bei Beförderungen konnten nur anhand der statistischen Signifikanz bewertet werden, da die 4/5-Regel nur Auswahlverfahren betrifft, bei denen es nur zwei Ergebnisse gibt (eingestellt oder nicht eingestellt, befördert oder nicht befördert). Die Bestehensquoten verstießen gegen die praktische 4/5-Regel und waren statistisch signifikant. Das bedeutete, dass Kandidaten aus Minderheiten bei der Prüfung schlechter abschnitten und eine Bestehensquote von weniger als 80 Prozent der weißen Kandidaten hatten. Kandidaten aus Minderheiten hatten auch statistisch signifikant niedrigere durchschnittliche Prüfungsergebnisse (6,6 Punkte niedriger) und durchschnittliche Verzögerungen bei Beförderungen (750 zusätzliche Tage).

Die Beförderungsquoten waren die wichtigste Kennzahl, denn letztendlich kommt es vor allem darauf an, wer als Polizeileutnant eingestellt wurde und wer nicht. Der p-Wert für die Beförderungsquoten lag bei 0,052 und damit knapp über dem Schwellenwert von 0,05, verstieß jedoch gegen die 4/5-Regel. Obwohl der Wert nur geringfügig über dem Schwellenwert lag, befand das Gericht dies aus zwei Gründen dennoch als ausreichenden Beweis für eine Ungleichbehandlung:
 

  • Obwohl der Grenzwert von 0,05 für die Feststellung der statistischen Signifikanz allgemein anerkannt ist, ist die Verwendung des Grenzwerts von 0,05 keine Regel für die Feststellung einer ungleichen Auswirkung, da es sich dabei nicht um ein Maß für die praktische Signifikanz handelt.
  • Da die einheitlichen Richtlinien nur eine „wesentlich unterschiedliche Auswahlquote“ zwischen zwei Gruppen erwähnen, liegt die Entscheidung über eine ungleiche Auswirkung im Ermessen der Gerichte. Die einheitlichen Richtlinien ermöglichen es den Gerichten, bei ihrer Gesamtbewertung der ungleichen Auswirkung die Begleitumstände und Umstände des Falles zu berücksichtigen. Im Fall BPD entschied das Gericht zugunsten der Kläger, dass eine ungleiche Auswirkung vorlag, da drei der vier Messgrößen (durchschnittliche Prüfungsergebnisse, durchschnittliche Verzögerungen bei Beförderungen und bestandene Prüfungsergebnisse) statistisch signifikante Unterschiede zwischen Minderheiten und Weißen aufwiesen. Darüber hinaus verstieß die Anzahl der Minderheiten, die die Prüfung bestanden hatten, im Vergleich zu Weißen gegen die 4/5-Regel.

Gerichtsurteil
 

  • Das Gericht entschied, dass bei der Durchführung der BPD-Prüfung eine ungleiche Auswirkung eingetreten war.

In Teil 2 dieses Artikels werden wir die Bewertung der Gültigkeit des Tests durch das Gericht untersuchen. Dieser Artikel erscheint in der Mai-Ausgabe des OFCCP Digest.
 

  1. Smith gegen Stadt Boston, 12-10291. 1. Cir. (2015).
  2. Ricci gegen DeStefano, 557 U.S. 557, 580 (2009).
  3. Griggs gegen Duke Power Co., 401 U.S. 424, 434 (1971).
  4. Einheitliche Richtlinien – Kommission für Chancengleichheit am Arbeitsplatz, Kommission für den öffentlichen Dienst, Arbeitsministerium und Justizministerium (25. August 1978), Verabschiedung einheitlicher Richtlinien für Mitarbeiterauswahlverfahren durch vier Behörden, 43 Federal Register, 38.290-38.315.↵
  5. Clavette, M. DCI Consulting. (2010). Eine Übersicht über die Messung negativer Auswirkungen in der Rechtsprechung. Washington, DC.

Anmerkung der Redaktion: Dieser Beitrag wurde ursprünglich auf Circaworks.com veröffentlicht. Im April 2023 übernahm Mitratech Circa, einen führenden Anbieter von Software für integratives Recruiting und OFCCP-Compliance. Der Inhalt wurde seitdem aktualisiert, um unser erweitertes Produktangebot, die sich entwickelnden Compliance-Vorschriften für die Talentakquise und Best Practices im Personalmanagement zu berücksichtigen.