Ausbildung & Karriere
Notenroulette
Ausbildung & Karriere
Lorem Ipsum
astefanei/adobe

Die Notenvergabe im Jurastudium hat ihre subjektiven Elemente – das hat jetzt auch eine Studie gezeigt. Ein Doktorand der LMU München ließ dieselben 15 Anfängerklausuren von jeweils 15 bzw. 16 Korrektoren bewerten. Das Ergebnis war frappierend: Im Extremfall gab es für ein und dieselbe Arbeit Zensuren zwischen vier und 14 Punkten.

7. Mai 2024

Das Experiment hat der Rechtsreferendar Clemens Hufeld durchgeführt und in der Zeitschrift für Didaktik der Rechtswissenschaft (ZDRW) veröffentlicht. Die umfangreiche Abhandlung wimmelt von Erläuterungen statistischer Methoden und räumt auch selbst einige Schwächen ein. So ist die Zahl der Stichprobe klein, die (echten) Klausuren waren wegen der Corona-Pandemie zuhause geschrieben worden, und die ehrenamtlich beteiligten Test-Bewerter dürften besonders gründlich gearbeitet haben, weil sie von der Untersuchung wussten (wie üblich erhielten sie auch eine Musterlösung). Ohnehin lässt sich fragen, ob Klausuren von Studierenden des dritten Semesters nicht noch besonders "unkonventionell" ausfallen – und daher umso schwerer zu benoten sind. Zumal die Aufgabenstellung anspruchsvoll war: Nach nur acht Wochen Vorlesungszeit behandelte sie an der bayerischen Universität das Verwaltungs- und Verwaltungsprozessrecht.

Durchschnittliche Spannbreite zwei Notenstufen

Dennoch: Die gebotene Chancengleichheit bleibt hier ziemlich auf der Strecke, die Objektivität der Leistungsnachweise ist stark eingeschränkt. Das Gesamtergebnis: Die durchschnittliche Abweichung zwischen niedrigster und höchster vergebener Note betrug atemberaubende 6,47 Punkte. Interessant: Der Gesamtdurchschnitt der am unterschiedlichsten bewerteten Arbeit lag bei 8,88 Punkten; jener, bei der sich die Korrektoren und Korrektorinnen am ehesten einig waren, hingegen bei 3,00 Punkten. Hufeld vermutet: "Es scheint einen Trend zu geben, dass die Varianz bei Klausuren, die im Durchschnitt durchgefallen waren, niedriger als bei hoch bewerteten Klausuren ist."

Ein möglicher Grund sei, dass im Durchfaller-Notenbereich unter 4 Punkten kein Unterschied bestehe, ob nun 0, 1, 2 oder 3 Punkte gegeben werden, so dass eine gewisse Einigkeit über die generelle Region der Klausur auf der Notenskala herrsche. Wegen der Remonstrationspraxis gegen Korrekturen könnten hier 2 Punkte häufiger als die direkt unter der Bestehensschwelle liegenden drei Punkte sein. Dennoch hätten 44 % der Prüfer dieser Arbeiten selbige durchkommen lassen, teilweise sogar mit 7 Punkten. Ein weiterer Kritikpunkt: Die Praxis führt laut Hufeld dazu, dass die realistisch erreichbare Skala den möglichen Punktebereich noch weiter einschränkt. "0 Punkte sind wohl nur möglich, wenn man ein leeres Blatt abgibt", schreibt der Verfasser. "Der Unterschied zwischen einem und zwei Punkten ist rein theoretischer Natur, so dass die Punkte 0 und 1 äußerst selten vorkommen. Ebenso verhält es sich mit 18 und 17 Punkten, die zwar nicht unmöglich sind, dann aber doch mit einer sehr geringen Wahrscheinlichkeit erreichbar sind."

Eine etwas widersprüchliche Aussage: "Es scheint nicht der Fall zu sein, dass Korrektorinnen und Korrektoren entweder insgesamt sehr gute oder sehr schlechte Noten geben." An anderer Stelle schreibt Hufeld freilich, "dass die (…) Bewertungen in sehr geringem Maß objektiv sind, sondern vielmehr von der korrigierenden Person abhängen". Es gebe einerseits Bewerter, die im Durchschnitt generell höhere oder niedrigere Noten vergäben. Andererseits fänden sich Klausuren, die manchen Korrektoren – unabhängig von deren sonstigem Bewertungsverhalten – besonders gut oder besonders schlecht gefallen hätten. Vor vorschnellen Verallgemeinerungen warnt der Forscher aber selbst, und um den Vorwurf der Willkür gehe es ihm schon gar nicht. Zudem weist er auf die persönlichen Verschiedenheiten der eingesetzten Hilfskräfte hin. Schließlich müssten Lehrstühle bei Grundkursklausuren mit bis zu 1.000 Bearbeitungen auf eine breite Gruppe an Personen zurückgreifen, die je zwischen zehn und 100 Klausuren bearbeiten.

Als Leser seines Fachaufsatzes könnte man also anmerken: Von der "Gaußchen Normalverteilung", bei der sich Messwerte in der Mitte ballen und deshalb grafisch als Glocke darstellen lassen, ist die juristische Ausbildungspraxis weit entfernt. Zumal ein Notenspektrum von 0 bis 18 Punkten bei dem hohen Maß an Subjektivität der Prüfer wohl viel zu ausdifferenziert ist. Und die Zensuren von der gesamten Breite der im Beruf geforderten Fähigkeiten nur einen Ausschnitt zeigen, was Arbeitgebern bei der Einstellungspraxis durchaus bewusst ist. Ein Trost: Bei den Klausuren im Staatsexamen gibt es stets einen Zweitkorrektor.

Dieser Inhalt ist zuerst in der NJW erschienen. Sie möchten die NJW kostenlos testen? Jetzt vier Wochen gratis testen inkl. Online-Modul NJWDirekt

Prof. Dr. Joachim Jahn ist Mitglied der NJW-Schriftleitung.