In Teil 1 haben wir uns mit der Entscheidung des Gerichts über die Frage befasst, ob eine unterschiedliche Auswirkung vorlag oder nicht. Wir werden nun die Entscheidung des Gerichts über die Gültigkeit des Tests untersuchen.

Gerichtsurteil über die Gültigkeit von Tests: Ist sie arbeitsplatzbezogen und mit der geschäftlichen Notwendigkeit vereinbar?

Da eine ungleiche Auswirkung nachgewiesen wurde, ging es in der zweiten Entscheidung des Falles darum, ob der Test von 2008 für die Position des Leutnants des Boston Police Department (BPD) sowohl arbeitsplatzbezogen war als auch mit der geschäftlichen Notwendigkeit übereinstimmte, wie in den einheitlichen Richtlinien gefordert. Arbeitsplatzbezogen und "im Einklang mit der geschäftlichen Notwendigkeit" bedeutet, dass der Test mit der Tätigkeit zusammenhängt und notwendig ist, damit das Unternehmen effektiv arbeiten kann.

Drei Arten von Prüfungsvalidierungsmethoden, die in den Einheitlichen Richtlinien beschrieben werden

In den Einheitlichen Richtlinien werden drei Arten von Testvalidierungsmethoden beschrieben, mit denen festgestellt werden kann, ob Praktiken, Verfahren oder Tests (PPT) arbeitsplatzbezogen sind und der geschäftlichen Notwendigkeit entsprechen: Kriterienvalidierung, Inhaltsvalidierung und Konstruktvalidierung. Die Uniform Guidelines enthalten eine Reihe von Mindestanforderungen, die bei der Durchführung von Validierungsstudien einzuhalten sind. Sie enthalten jedoch keine übermäßig spezifische Methodik, die befolgt werden muss, damit eine Validierungsstudie als potenziell rechtlich vertretbar angesehen werden kann. Die erste Validierungsmethode, die Kriteriumsvalidität, liefert statistische Beweise dafür, dass diejenigen, die im PPT besser abschneiden, mit größerer Wahrscheinlichkeit auch am Arbeitsplatz erfolgreich sind, was zeigt, dass das PPT arbeitsplatzbezogen ist. Die zweite Validierungsmethode, die Inhaltsvalidität, liefert den schlussfolgernden Beweis, dass ein PPT arbeitsplatzbezogen ist. Dies wird durch eine eingehende Untersuchung des Arbeitsplatzes (eine Arbeitsplatzanalyse) und eine Reihe von Meinungsumfragen bei Fachexperten (SME) erreicht. Die dritte Validierungsmethode, mit der bewertet wird, ob das PSM arbeitsplatzbezogen ist, ist die Konstruktvalidität. Die Konstruktvalidität wird durch die Identifizierung der Beziehungen zwischen drei Dingen nachgewiesen: einem spezifischen arbeitsplatzbezogenen Merkmal, einem PSM, das dieses Merkmal misst, und Messungen der Arbeitsleistung. Aufgrund der Schwierigkeit und Komplexität des Nachweises der Konstruktvalidität wird diese Methode bei PSM-Evaluierungen nur selten eingesetzt.

Sowohl Kriteriums- als auch Inhaltsvalidierungsstudien beginnen in der Regel mit einer Überprüfung von Dokumenten, die zuvor erstellte Arbeitsplatzanalysen, Arbeitsplatzbeschreibungen und andere Informationen enthalten, die der Arbeitgeber möglicherweise entwickelt hat. Diese Dokumente beschreiben in der Regel die wichtigen Aufgaben, die von den Mitarbeitern in der Position ausgeführt werden, sowie die Kenntnisse, Fertigkeiten, Fähigkeiten und persönlichen Merkmale (KSAPCs), die zur Ausführung dieser Aufgaben erforderlich sind. Kenntnisse, Fertigkeiten, Fähigkeiten und persönliche Eigenschaften sind Attribute, die für die erfolgreiche Ausführung von Aufgaben erforderlich sind. Diese Informationen dienen als Grundlage für die erforderliche Arbeitsplatzanalyse, im Falle einer Inhaltsvalidierungsstudie oder im Falle einer Kriteriumsvalidierungsstudie für eine Arbeitsplatzanalyse. Eine Arbeitsplatzanalyse ist eine eingehende Analyse des Arbeitsplatzes, für den ein PPT erstellt werden soll, und umfasst die Dokumentation der wichtigen Aufgaben, die von den Inhabern des Arbeitsplatzes ausgeführt werden, sowie der KSAPCs, die zur Ausführung dieser Aufgaben erforderlich sind. Dazu gehört auch die Erhebung von Umfragedaten bei den KMU zu diesen KSAPCs in verschiedenen Bereichen, wie z. B. dem Grad der Wichtigkeit und der Häufigkeit der KSAPCs und der Arbeitsaufgaben. Eine Arbeitsplatzanalyse ist weit weniger streng als eine Arbeitsplatzanalyse. Eine Arbeitsplatzanalyse beinhaltet die Überprüfung von Arbeitsplatzinformationen, um die für den Arbeitsplatz relevanten Maßstäbe für das Arbeitsverhalten oder die Arbeitsleistung zu ermitteln. Im Fall der BPD-Prüfung wurde ein Ansatz zur Inhaltsvalidierung gewählt und daher eine Arbeitsplatzanalyse durchgeführt.

Inhaltliche Gültigkeit der Dokumentation

Bei der Durchführung einer Arbeitsplatzanalyse kann eine Vielzahl von Methoden verwendet werden. Je genauer die Methodik jedoch den Einheitlichen Richtlinien Abschnitt 14C für die Inhaltsvalidität folgt, desto besser ist die Arbeitsplatzanalyse vor Gericht zu verteidigen. Die Einheitlichen Richtlinien beschreiben auch, wie die Arbeitsplatzanalyse, die Testentwicklung und die Testvalidierung für Studien zur Inhalts-, Kriteriums- und Konstruktvalidität unterschiedlich dokumentiert werden müssen. Dies ist für Arbeitgeber wichtig, denn je genauer der Testentwickler die einzelnen Schritte der Arbeitsplatzanalyse, der Testentwicklung und der Testvalidierung dokumentieren kann, desto eher ist das Auswahlverfahren rechtlich vertretbar. In Abschnitt 15C der Einheitlichen Richtlinien werden 19 verschiedene wesentliche Elemente und acht verschiedene Elemente aufgeführt, die für die Inhaltsvalidität enthalten sein sollten. Bestimmte Elemente sollten, falls zutreffend, einbezogen werden, auch wenn sie nicht als wesentlich aufgeführt sind, weil bestimmte Umstände die Einbeziehung dieser Elemente erschweren würden oder weil manchmal alternative Ansätze gewählt werden können.

Zu den erforderlichen Bereichen gehören die folgenden:

  • Datum und Ort der Arbeitsplatzanalyse
  • die Umstände, unter denen die Studie durchgeführt wurde
  • Elemente der Arbeitsplatzanalyse
  • Elemente des Auswahlverfahrens und dessen Inhalt
  • die Beziehung zwischen dem Auswahlverfahren und der Stelle
  • alternative Auswahlverfahren untersucht
  • Einsatz und Anwendung des Auswahlverfahrens
  • Kontaktperson
  • Genauigkeit und Vollständigkeit

In den folgenden Abschnitten wird eine Überprüfung der Unterlagen vorgenommen und erörtert, wie die Stadt diese Elemente berücksichtigt bzw. nicht berücksichtigt hat.

Arbeitsplatzanalyse des Lieutenants des Boston Police Department untersucht

Als nächstes wurde die Arbeitsplatzanalyse des BPD-Lieutenants daraufhin untersucht, ob sie den Anforderungen der Inhaltsvalidierung in den Einheitlichen Richtlinien entspricht. Im Falle der BPD-Prüfung war das Gericht der Ansicht, dass die Stadt die Anforderungen der Einheitlichen Richtlinien an die Arbeitsplatzanalyse ausreichend erfüllt hat.

Die Rolle eines Leutnants der Polizei von Boston

Bevor die Überprüfung der Unterlagen zur Arbeitsplatzanalyse erläutert wird, ist es wichtig, sich zunächst einen Überblick über die Rolle eines BPD-Lieutenants zu verschaffen. Bei der Untersuchung der Unterlagen für die Arbeitsplatzanalyse, um festzustellen, ob der Test berufsbezogen und geschäftlich notwendig war, wurde festgestellt, dass Lieutenants beim Boston Police Department als Vorgesetzte der zweiten Reihe fungieren, die Sergeants beaufsichtigen, und Sergeants beaufsichtigen Polizeibeamte. Leutnants sind auch für die Polizeiwachen zuständig, nehmen Verdächtige fest und sind für die Sicherheit der Gefangenen verantwortlich. Auf dem Revier ist auch ein erheblicher Anteil an Schreibtischarbeit erforderlich.

Leutnants müssen auch außerhalb der Wache arbeiten, z. B. bei Bürgerversammlungen mit Bürgern sprechen und die Kontrolle über die Schauplätze größerer Vorfälle übernehmen. Zu den von den Lieutenants geforderten Aufsichtsfähigkeiten gehört die Fähigkeit, Mitarbeiter zu motivieren und Informationen zwischen den Dienstgraden zu vermitteln. Die offizielle Stellenbeschreibung für den Lieutenant hat sich seit 1979 nicht geändert, und der derzeitige Polizeipräsident von Boston, William Evans, sagte aus, dass sie immer noch zutreffend sei. Die Einheitlichen Richtlinien betonen die Aktualisierung von Arbeitsplatzanalysen, wenn sich der Arbeitsplatz im Laufe der Zeit verändert, und geben als Faustregel an, Arbeitsplatzanalysen alle fünf Jahre zu überprüfen.

Arbeitsplatzanalysen, die als Grundlage für die Erstellung der BPD-Prüfung dienten

Im Folgenden werden die Arbeitsplatzanalysen, die im vorliegenden Fall als Beweismittel verwendet wurden, ausführlicher erläutert. Drei verschiedene Arbeitsplatzanalysen dienten als Grundlage für die Entwicklung der im BPD-Fall verwendeten Prüfung von 2008: eine 1991 durchgeführte Arbeitsplatzanalyse, eine weitere aus dem Jahr 2000, die einige Elemente der Arbeitsplatzanalyse von 1991 enthielt, und eine verkürzte Arbeitsplatzanalyse aus dem Jahr 2008. Die verkürzte Arbeitsplatzanalyse von 2008 war eine leichte Aktualisierung der Arbeitsplatzanalyse von 2000. Die verkürzte Arbeitsplatzanalyse von 2008 wurde schließlich für die Erstellung der Prüfung von 2008 verwendet. Hier werden nur die Arbeitsplatzanalysen von 2000 und 2008 erläutert, da sie für die Entwicklung der Prüfung von 2008 am grundlegendsten waren.

2000 Arbeitsplatzanalyse

Für die Arbeitsplatzanalyse 2000 beauftragte die Stadt ein externes Beratungsunternehmen. Das Unternehmen erstellte zunächst eine Liste von 302 möglicherweise relevanten Aufgaben, die Leutnants der Bostoner Polizei ausführen, sowie von Kenntnissen, Fähigkeiten und Fertigkeiten (KSA), die zur Ausführung dieser Aufgaben erforderlich sind. Zwölf kleine und mittlere Unternehmen (KMU), bestehend aus Mitarbeitern des Ministeriums mit dem Rang eines Leutnants oder höher, bewerteten die Aufgaben hinsichtlich ihrer Häufigkeit, Wichtigkeit, der Notwendigkeit, die Aufgabe bei Dienstantritt auszuführen, und des Zusammenhangs zwischen der erfolgreichen Ausführung der Aufgabe und der erfolgreichen Arbeitsleistung. Wenn 10 der KMU eine Aufgabe bei Arbeitsantritt als "sehr wichtig" oder "wichtig" einstuften und der Meinung waren, dass die Ausführung dieser Aufgabe die besten oder besseren Mitarbeiter eindeutig von den schlechteren unterscheidet, dann erfüllte sie die Kriterien der Stadt, um in die endgültige Arbeitsplatzanalyse aufgenommen zu werden. Von den ursprünglich 302 Aufgaben erfüllten 281 die Kriterien.

Die KMU wurden dann gebeten, zu bestimmen, welche der folgenden Dimensionen für jede Aufgabe erforderlich waren: mündliche Kommunikation, zwischenmenschliche Fähigkeiten, Problemerkennung und -analyse, Urteilsvermögen sowie Planung und Organisation. Dann wurde eine Liste von 149 KSAs erstellt, die für die Ausführung der 281 Aufgaben potenziell erforderlich sind. Anschließend wurden die KMU gefragt, ob sich die KSA auf den Beruf des Polizeileutnants bezogen, wann die KSA erlernt wurde (vor oder nach der Zuweisung zu dem Beruf), wie lange es dauerte, die KSA zu erlernen, wie sich die KSA auf die Leistung auswirkte und ob die KSA erforderlich war, um den Beruf effektiv auszuüben.

Damit eine KSA wichtig genug ist, um geprüft zu werden, müssen neun der 12 KMU die KSA als wichtig eingestuft haben:

  • im Zusammenhang mit der Tätigkeit
  • die vor der Zuweisung zum Beruf gelernt wurden
  • die mehr als eine kurze Einarbeitungszeit erfordern
  • mit der Fähigkeit, Leistungen in hohem oder mittlerem Maße zu unterscheiden
  • erforderlich oder wünschenswert, um die Arbeit effektiv auszuführen

Von den 149 KSA, die von den KMU bewertet wurden, erfüllten 145 die Kriterien.

2008 Arbeitsplatzanalyse

Für die Arbeitsplatzanalyse 2008 wurden die KMU gebeten, jede der 149 KSA, die bei der im Jahr 2000 durchgeführten Arbeitsplatzanalyse verwendet wurden, erneut zu bewerten. Die KMU bewerteten 2008 eine ausreichende Anzahl der 149 KSAs als wichtig genug, um getestet zu werden, da sie die zuvor genannten Kriterien erfüllten.

Gerichtsurteil zur Arbeitsplatzanalyse

  • Das Gericht war der Ansicht, dass die Stadt die Anforderungen der einheitlichen Leitlinien an die Arbeitsplatzanalyse ausreichend erfüllt hat.

Testentwicklung und Validierung

In der nächsten Phase untersuchte das Gericht, inwieweit der Inhalt der Prüfung mit der Tätigkeit in Zusammenhang steht. Das Gericht untersuchte die Entwicklung des Tests und seine Validierung. Das Gericht untersuchte auch, wie die Behörde die Prüfung für Beförderungsentscheidungen nutzte. Die Prüfung von 2008 bestand aus zwei Elementen: einer schriftlichen Prüfung mit 100 Multiple-Choice-Fragen und einer Bewertung von Ausbildung und Erfahrung (E&E). Im nächsten Abschnitt wird untersucht, nach welcher Methode die Prüfungen entwickelt wurden, inwieweit die Prüfung repräsentativ für die Stelle war und wie die Prüfung zur Auswahl der Leutnants verwendet wurde.

Häufig wird die Arbeitsplatzanalyse abgeschlossen, bevor die Multiple-Choice-Prüfung erstellt wird. Der Testentwickler wandelt die Arbeitsplatzanalyse dann häufig in ein Testplandokument um, in dem beschrieben wird, welche KSAs in der Prüfung bewertet werden sollen. Auf diese Weise wird sichergestellt, dass die Prüfung eine repräsentative Stichprobe der Tätigkeit darstellt. In diesem Fall wurde ein Testplan erstellt, und es wurden 100 Testaufgaben erstellt, um bestimmte KSAs zu messen. Die KMUs überprüften dann die Testfragen, ermittelten, welche KSAs zu den Fragen passten, und bewerteten die Fragen nach Schwierigkeit, Lesbarkeit und Empfehlung für die Verwendung. Die Meinung der KMU ist in dieser Phase des Testentwicklungsprozesses von entscheidender Bedeutung, da sie bestätigt, dass die Testaufgaben mit der Tätigkeit in Zusammenhang stehen. Das Gericht war der Ansicht, dass die Stadt die einheitlichen Richtlinien für diesen Teil des Prozesses angemessen berücksichtigt hat.

Der erste Teil der Prüfung, die Ausbildung und Erfahrung, wurde vom Gericht auf seine Übereinstimmung mit den Einheitlichen Richtlinien geprüft. Die E&E-Punktzahl war ein Maß für die vorherige Ausbildung und Erfahrung. Von 100 möglichen Punkten in der schriftlichen Prüfung verlangte die Stadt, dass die Kandidaten mindestens 70 Punkte erreichen mussten, um die Prüfung zu bestehen. Die E&E-Punktzahl wurde dann nur für die Kandidaten berechnet, die die schriftliche Prüfung bestanden hatten. Der schriftliche Teil machte 80 % der Endnote aus, die E&E-Komponente 20 %. Jeder Kandidat erhielt automatisch 14 der insgesamt 20 Punkte für die E&E. Das Gericht beschloss schließlich, den gesamten E&E-Teil der Prüfung aus der Analyse auszuschließen, da er im Vergleich zur schriftlichen Prüfung nur wenig zur Rangfolge der Bewerber auf der Eignungsliste beitrug. Tatsächlich betrug die Korrelation zwischen den Ergebnissen der schriftlichen Prüfung und dem Ergebnis der Abschlussprüfung 0,95, eine fast perfekte positive Korrelation. Eine Eignungsliste ist eine Liste von Bewerbern, die für eine Einstellung in Frage kommen. Die Stadt hat auch keine Belege dafür vorgelegt, dass die E&E mit den Aufgaben oder KSAs aus der Arbeitsplatzanalyse verknüpft sind.

Als nächstes untersuchte das Gericht die Beweise dafür, inwieweit die Prüfung eine repräsentative Stichprobe der beruflichen Fähigkeiten bewertete. Dies geschah, weil es in den Einheitlichen Richtlinien in 14(C)(1) heißt: "Ein Auswahlverfahren kann durch eine Strategie der Inhaltsvalidität gestützt werden, soweit es eine repräsentative Stichprobe des Inhalts der Stelle darstellt." Die Arbeitsplatzanalyse aus dem Jahr 2000 ergab, dass es 145 KSAs gab, die für die Ausübung des Arbeitsplatzes entscheidend sind. Zwar gab es 13 Wissenskategorien, die in der schriftlichen Prüfung abgefragt wurden, doch waren diese sehr weit gefasst, und es wurde geschätzt, dass etwa 80 % der Kenntnisse unter diese Kategorien fallen könnten. Letztendlich wurden jedoch nur zwei der kritischen Fähigkeitsbereiche geprüft. Das Gericht kam daher zu dem Schluss, dass in der Prüfung von 2008 keine repräsentative Auswahl der kritischen KSAs geprüft wurde, da die Prüfung viele der für die Ausübung der Tätigkeit eines Leutnants erforderlichen Fähigkeiten und Fertigkeiten nicht widerspiegelte. Bei der Gesamtbewertung der Inhaltsvalidität war dies einer der Hauptgründe dafür, dass die Prüfung letztlich nicht den Standards der Einheitlichen Richtlinien entsprach. In früheren Jahren hatte die Stadt ein Assessment Center eingesetzt, mit dem Fähigkeiten und Fertigkeiten wie mündliche Kommunikationsfähigkeit, zwischenmenschliche Fähigkeiten, die Fähigkeit, ein Problem schnell zu erkennen und zu analysieren, die Fähigkeit, rasch fundierte Entscheidungen zu treffen, und die Fähigkeit, Arbeit in Teilaufgaben zu zerlegen und Prioritäten zu setzen, geprüft wurden. Diese Fähigkeiten wurden durch eine Reihe von Übungen bewertet, darunter eine In-Basket-Übung (eine simulierte schriftliche Übung) und eine situationsbezogene Übung. Bei der Situationsübung wurden die Bewerber auf Video aufgezeichnet, wie sie auf hypothetische Szenarien, denen ein Leutnant begegnen könnte, verbal antworteten. Die Stadt entschied sich bei der Prüfung 2008 gegen ein Assessment Center. Hätte sie sich jedoch dafür entschieden, wäre es sehr viel wahrscheinlicher, dass das Gericht die Prüfung als repräsentativ für die Stelle eingestuft hätte. Dies liegt daran, dass mehr Fähigkeiten und Fertigkeiten wie Kommunikationsfähigkeit, zwischenmenschliche Fähigkeiten und situationsbezogenes Urteilsvermögen hätten gemessen werden können.

Das Gericht wertete dann die Beweise für die Zuverlässigkeit des Tests aus. Abschnitt 14 (C)5 der Einheitlichen Richtlinien besagt: "Wann immer dies möglich ist, sollten geeignete statistische Schätzungen der Zuverlässigkeit des Auswahlverfahrens vorgenommen werden." Die Zuverlässigkeit hätte in diesem Fall wahrscheinlich das Ausmaß gemessen, in dem die Aufgaben in der Prüfung denselben Bereich, z. B. berufliche Kenntnisse, messen. Die Stadt hat keine Beweise für die Durchführung von Zuverlässigkeitsanalysen vorgelegt, was das Gericht beanstandete.

Gerichtsurteil

  • Es wurden nicht genügend KSAs getestet.
  • Die Zuverlässigkeit des Tests wurde nicht nachgewiesen.

Bewertung der Verwendung der Prüfung für Auswahlentscheidungen

Ein weiterer wichtiger Aspekt bei der Bewertung der Validität eines PPT ist die Art und Weise, wie es für eine Auswahlentscheidung verwendet wird. Es gibt drei primäre Möglichkeiten, wie ein Test für Auswahlentscheidungen verwendet werden kann. Wenn das Ziel darin besteht, qualifizierte von unqualifizierten Bewerbern zu unterscheiden, sollte der Test auf der Basis "bestanden/nicht bestanden" eingesetzt werden, wobei eine Mindestpunktzahl für das Bestehen festgelegt wird. Wenn das Ziel darin besteht, zwischen Bewerbern zu unterscheiden, die gleichermaßen qualifiziert sind, aber möglicherweise leicht unterschiedliche Rohwerte in einem PPT haben, dann sollte der Ansatz des Banding verwendet werden. Banding ist ein statistisches Verfahren, bei dem Bewerber mit ähnlicher Punktzahl in Gruppen eingeteilt werden, wobei jede Gruppe als gleichwertig betrachtet werden kann. Das Ranking sollte verwendet werden, wenn das Ziel darin besteht, Entscheidungen auf der Grundlage der Testergebnisse für jeden einzelnen Bewerber zu treffen. Mit anderen Worten: Der Test wird in einer Rangfolge verwendet, um die Bewerber entweder einzustellen oder im Auswahlverfahren weiterzuleiten, beginnend mit dem Anfang der Liste und absteigend. Sollen Entscheidungen über Bewerber auf der Grundlage mehrerer Auswahlverfahren für mehrere KSAPCs getroffen werden, die unterschiedlich wichtig sind, so kann ein gewichtetes oder kombiniertes Auswahlverfahren verwendet werden. Das von den Gerichten geforderte Maß an Validität und Verlässlichkeit nimmt zu, wenn man von "bestanden/nicht bestanden" über "Banding" zu "Ranking" übergeht (Biddle, 2011 1). Da die Art und Weise, wie der Test verwendet wird, für die Bestimmung der Gesamtvalidität des Tests so wichtig ist, untersuchen die Gerichte die Art und Weise, wie der Test verwendet wird, mit großer Sorgfalt.

Die Stadt hat sich dafür entschieden, eine Mindestpunktzahl für das Bestehen der Prüfung festzulegen. In Abschnitt 5(H) der Einheitlichen Richtlinien heißt es: "Wenn Grenzwerte [Mindestpunktzahlen für das Bestehen] verwendet werden, sollten sie normalerweise so festgelegt werden, dass sie angemessen sind und mit den normalen Erwartungen an akzeptable Fähigkeiten innerhalb der Belegschaft übereinstimmen. Nehmen wir an, es wurde ein Multiple-Choice-Test für einen Polizeianfänger entwickelt, bei dem alle Aufgaben vollständig arbeitsrelevant sind, aber eine willkürliche Mindestpunktzahl von 90 % für das Bestehen festgelegt wurde. Welche Beweise gibt es dafür, dass 90 % die richtige Mindestpunktzahl ist, um geringfügig qualifizierte Bewerber genau zu identifizieren? Ohne die Angaben von Berufsexperten darüber, was ein minimal qualifizierter Kandidat bei dem Test erreichen würde, lässt sich eine Mindestpunktzahl von 90 % nicht rechtfertigen. Die Stadt wählte für die Prüfung 2008 eine Mindestpunktzahl von 70 %, begründete dies jedoch nicht. Sie beschloss, den schriftlichen Teil der Prüfung mit 80 % und den E&E-Teil mit 20 % zu gewichten. Unter Verweis auf frühere Prüfungen gab die Stadt an, sie sei der Meinung, dass die KMU wahrscheinlich die Gewichtungsformel 80 %/20 % gewählt hätten. Die KMU wurden jedoch nie tatsächlich befragt, um dies festzustellen. Es gab keinen Hinweis darauf, dass die Stadt irgendwelche Analysen durchgeführt hat, um die Cutoff-Punkte und die Gewichtung zu stützen.

Für die Kandidaten, die die schriftliche Prüfung mit 70 % richtig bestanden haben, wurde die E&E-Punktzahl dann auf ihre Gesamtpunktzahl angewandt und die Kandidaten wurden in einer Rangfolge für die Beförderung ausgewählt. Abschnitt 5(G) der Einheitlichen Richtlinien besagt: "Nachweise, die für die Anwendung eines Auswahlverfahrens auf der Grundlage von bestanden/nicht bestanden (Screening) ausreichen, können für die Anwendung desselben Verfahrens auf der Grundlage einer Rangfolge unzureichend sein." Da die Zuverlässigkeits- und Gültigkeitsstandards für die Erstellung von Rangfolgen am höchsten sind, hat das Gericht diesen Aspekt des Auswahlverfahrens besonders genau unter die Lupe genommen.

Gerichtsurteil

  • Das Gewichtungsschema der schriftlichen Prüfung und der E&E war nicht gerechtfertigt.
  • Es wurde ein willkürlicher Grenzwert von 70 % verwendet, der sich nicht rechtfertigen ließ.

Allgemeine Gerichtsurteile

Im Fall der BPD-Prüfungsverwaltung stellte das Gericht zunächst fest, dass eine ungleiche Auswirkung stattgefunden hatte. Im nächsten Teil des Gerichtsverfahrens wurde untersucht, ob die Prüfung die in den einheitlichen Richtlinien festgelegten Standards für die inhaltliche Validität erfüllt. Während das Gericht feststellte, dass der Teil der Arbeitsplatzanalyse die Standards für die inhaltliche Validität erfüllte, entschied das Gericht, dass die Prüfung selbst die Standards für die inhaltliche Validität aus den folgenden Gründen nicht erfüllte:

  • Es wurden nicht genügend KSAs getestet.
  • Die Zuverlässigkeit des Tests wurde nicht nachgewiesen.
  • Das Gewichtungsschema der schriftlichen Prüfung und der E&E war nicht gerechtfertigt.
  • Es wurde ein willkürlicher Grenzwert von 70 % verwendet, der sich nicht rechtfertigen ließ.

Diskussion

Die potenziellen Kosten eines Rechtsstreits sind hoch, und es ist von großem Wert, ein gültiges Auswahlverfahren zu haben, das die besten Bewerber für die Stelle ermittelt. Wenn Sie den Ablauf eines Verfahrens nach Titel VII (Disparate Impact) verstehen, kann dies Ihrer Behörde helfen, fundierte Entscheidungen über Ihr Testverfahren zu treffen. Dieser Fall hat einige der vielen Aspekte hervorgehoben, die bei der Bewertung von disparaten Auswirkungen zu berücksichtigen sind, sowie die Rolle der Arbeitsplatzanalyse, der Testentwicklung und der Testvalidierung bei der Bewertung einer Anfechtung nach Titel VII (disparate impact). Ein gründliches Verständnis der Einheitlichen Richtlinien ist von entscheidender Bedeutung, um zu verstehen, wie Gerichte Klagen über die Validierung von Tests mit ungleichen Auswirkungen beurteilen. Dieser Fall folgt zwar einem typischen Prozess, aber jeder Fall ist etwas anders. Wäre beispielsweise ein Ansatz zur Kriteriums- oder Konstruktvalidierung verwendet worden, wäre der Test auf Übereinstimmung mit den Einheitlichen Richtlinien Abschnitt 15(B) für kriteriumsbezogene Validitätsstudien bzw. Abschnitt 15(D) für Konstruktvaliditätsstudien geprüft worden. Im vorliegenden Fall wurden ein Maß für Bildung und Erfahrung und ein schriftlicher Multiple-Choice-Test bewertet. Es gibt jedoch eine Vielzahl anderer PPTs, die vor Gericht verhandelt werden, darunter Interviews, Arbeitsprobentests, Persönlichkeitstests und Tests der körperlichen Fähigkeiten, um nur einige zu nennen.

1. Biddle, D. A. (2011). Adverse Impact and Test Validation: A Practitioner's Handbook (3. Aufl.). Scottsdale, AZ: Infinity Publishing.↵

Anmerkung der Redaktion: Dieser Beitrag wurde ursprünglich auf Circaworks.com veröffentlicht. Im April 2023 übernahm Mitratech Circa, einen führenden Anbieter von Software für integratives Recruiting und OFCCP-Compliance. Der Inhalt wurde seitdem aktualisiert, um unser erweitertes Produktangebot, die sich entwickelnden Compliance-Vorschriften für die Talentakquise und Best Practices im Personalmanagement zu berücksichtigen.