Laut eines kurzen Zeit-Online-Artikels gibt es sie: die Langzeitstudenten auch im Bachelor (hier ist der Artikel). Der Beitrag erzählt die Geschichte eines Studierenden der Medienwissenschaft und macht klar: Lange studieren geht offenbar auch im Bachelor (jedenfalls an manchen Unis) und muss keinesfalls Ausdruck von Faulheit sein. Voraussetzung freilich ist, dass Studierende nicht eine bestimmte CP-Zahl bis zu einem vorgegebenen Zeitpunkt vorweisen müssen oder nach Ablauf der Regelstudienzeit aus der Uni fliegen. Immerhin zeigt die Einzelfallgeschichte: Etwas mehr individuelle Flexibilität stünde wohl jedem Studiengang gut, denn es gibt viele Gründe, warum Lern- und Bildungsprozesse mal länger dauern oder Umwege brauchen ODER eben mal in vergleichsweise kurzer Zeit oder auf direktem Wege möglich sind. Vom Weg immer gleich auf die Qualität des Ergebnisses zu schließen, ist unangemessen. Das gilt aus meiner Sicht aber auch für den „Turbo-Bachelor“, also auch für die, die ihr Studium schnell beenden. Auch da muss man schon genau hinschauen und die einzelne Person im Blick haben, denn: Zügig ist sicher nicht gleich oberflächlich.
So wird das nichts
Evaluationen in der Hochschullehre sind heute Standard. Das ist an sich ein relativ neues Phänomen. Als ich studiert habe (na ja, das ist natürlich auch sehr lange her – so in der zweiten 1980er Hälfte) gab es allenfalls eine kurze Feedback-Runde am Ende eines Seminars – vielleicht. Vorlesungen wurden gar nicht bewertet. Auch später, als ich meine eigenen ersten Veranstaltungen angeboten oder daran mitgearbeitet habe, war das Ob und Wie fast ausschließlich Sache des Dozenten. Nur an und zu gab es mal „stichprobenartig“ einen Fragebogen, der seitens des Studiendekanats verteilt wurde – alle paar Jahre.
Heute hat man in Hochschulleitungen eigene Ämter geschaffen, die dafür da sind, die Qualität der Lehre zu „sichern und weiterzuentwickeln“ und damit halt auch – ja, ich nenne es mal so – zu überwachen. Dazu sammelt man Daten. Eine wichtige Datenquelle ist die Evaluation von Lehrveranstaltungen. Das hängt natürlich auch mit den Akkreditierungen zusammen. Was davon also eine aus den Hochschulen quasi von innen kommende Entwicklung und was Reaktion auf Notwendigkeiten von außen ist, lässt sich wohl schwer abschätzen. Aber um das geht es mir an dieser Stelle nicht.
Nein, mir geht es in diesem kurzen Beitrag eher darum, mal zu explizieren, warum ich bei den aktuellen Evaluationen so ein ungutes Gefühl habe. Dabei ziehe ich nicht den Sinn in Zweifel, DASS evaluiert wird. Das ist gut so. Es ist begrüßenswert, dass man über Lehre spricht, dass man versucht, sich ein Bild über die Qualität der Lehre zu machen, und wenn man dann auch noch Anstrengungen unternimmt, diese zu verbessern – wunderbar! Früher war es definitiv NICHT besser. Aber ich glaube einfach nicht (mehr), dass uns das mit den jetzt nahezu etablierten Mitteln, insbesondere nicht mit den klassischen Studierendenbefragungen, gelingt. Warum nicht?
Das erste Problem ist schon mal Folgendes: Kommuniziert wird, dass man Veranstaltungen evaluiert. Aber wenn man sich mal die üblichen Evaluationsbögen ansieht, dann werden der Lehrende, sein Lehrkonzept und dessen Umsetzung, seine Ziele und Zielerreichung und sein Verhalten, vielleicht auch ein paar Rahmenbedingungen erfasst und bewertet bzw. evaluiert. Also da fehlen mir die Lernenden! Ob eine Veranstaltung gelingt oder nicht, hängt nicht nur vom Lehrkonzept und dessen Umsetzung ab, also von dem, was sich der Lehrende überlegt hat und wie er dann handelt. Es hängt ja wohl auch von den Studierenden und davon ab, inwieweit sie sich an dem Angebot beteiligen und wie sie selbst handeln. Niemand bestreitet in der Regel, dass für gelungene Bildungsprozesse die Interaktion zwischen Lehrenden, Lernenden und der Sache, um die es geht, entscheidend ist. Der Lehrende kann daran einen großen Anteil haben, aber die Evaluation allein des Lehrenden bleibt auf halbem Wege stehen, wenn man sich ein Urteil über Lehrveranstaltungen bilden will.
Um sich von einer Veranstaltung und deren Qualität ein Bild machen zu können, das einigermaßen valide ist, müsste man an sich ganz selbstverständlich auch die Studierenden und deren Handeln in die Evaluation mit einbeziehen: Was bringen Studierende von sich aus in die Veranstaltung ein? Wie beteiligen sie sich, wie bereiten sie etwas vor und nach, wie unterstützen sie sich gegenseitig etc.?
Es ist völlig in Ordnung, dass Studierende ein Urteil über einen Lehrenden abgeben. Aber auch Studierende müssten (als Gruppe) in dem Sinne „bewertet“ werden, wie sie zum Erfolg einer Veranstaltung beitragen. Das könnte der Lehrende machen (analog zur Lehrenden-Bewertung seitens der Studierenden); besser wäre sicher ein externes Urteil, was aber freilich organisatorische Probleme aufwirft. Ebenfalls sinnvoll wäre es, dass Studierende von Zeit zu Zeit untereinander die Dynamik einer Veranstaltung und das gemeinsame Handeln einschätzen. Das heißt aber dann letztendlich: Man muss miteinander ins Gespräch kommen! Und das ist etwas ganz anderes, als Kreuzchen auf Fragebögen zu machen.
Ja, ich weiß, was jetzt für ein Einwand kommt – die Anonymität ist wichtig. Das sehe ich auch – zumindest so lange wir noch Prüfungen mit Rechtsfolgen haben. Ein Hindernis für gegenseitiges transparentes Feedback dürfte außerdem sein, wenn Evaluationen vorrangig gemacht werden, damit Akkreditierungsagenturen Ruhe gebe, wenn sie also vor allem formal das Signal aussenden sollen, dass man ja etwas für die Qualität der Lehre tut. Unter so einem Vorzeichen ist es schwierig, eine Kultur aufzubauen, die dergestalt ist, dass alle ein echtes Interesse an guter Lehre haben und jeder (!) seinen Teil dazu beiträgt: Lehrende und Studierende.
Aber ich fürchte, die Tendenz geht in eine andere Richtung: immer mehr Evaluationen – parallel dazu immer weniger Rücklauf, weil Studierenden freilich schon langsam die Nase voll davon haben, Fragebögen auszufüllen; immer mehr Daten – parallel dazu immer weniger Ideen, was man damit eigentlich genau anfangen soll; immer mehr zentrale Vorgaben – parallel dazu immer weniger gegenseitiges Vertrauen und Lust, sich an diesen Routinen zu beteiligen.
Also ich weiß nicht – so wird das doch nichts, oder?
Neun Monate Lehre
Nächste Woche beginnt bei uns an der UniBwM das neue Studienjahr. Ein Studienjahr – das bedeutet für uns Lehrende: neun Monate fast durchgängig Lehre, nämlich in Form von drei Trimestern, die weitgehend nahtlos aneinander anschließen. Ich kann nun auf zwei Studienjahre (und das erstes Trimester im Frühjahr 2010) zurückblicken und aktuell festhalten: Alle Bachelor- und Master-Module bzw. -Veranstaltungen sollten inzwischen (mit Ausnahme eines Masterseminars, das ich jetzt im Herbst zum ersten Mal anbiete) weitgehend „sattelfest“ sein, das heißt: Erste Anpassungsschwierigkeiten der mir vertrauten Lehrkonzepte auf die Anforderungen an die bildungswissenschaftlichen Studienprogramme (also BA und MA) an der UniBw sind aus meiner Sicht zumindest in einer ersten Runde überstanden. Ich habe zu diesem Thema (Lehre an der UniBw) ja des Öfteren was gebloggt. Ich stelle mal ein paar Links zusammen – beginnend mit den ersten Erfahrungen im Frühjahr/Sommer 2010 bis zum letzten Blog-Post zu diesem Thema im Juni 2012:
- Die ersten Erfahrungen: hier
- Anmerkungen zum Feedback: hier
- Evaluationsseminar: hier
- Lehrerfahrungen generell (Vortrag): hier
- Vorlesungen: hier
- Unterstützung der Bachelorarbeitsphase: hier
Dass Lehrentwicklungen und -anpassungen erforderlich waren, finde ich nicht schlimm. Meine Mitarbeiter, vor allem Silvia, haben mir dabei immer tatkräftig geholfen. Schade fand ich eher, dass sich viele der Studierenden, die quasi die „Pionierphase“ mitgemacht haben, benachteiligt fühlten. Diese Einstellung kannte ich aus unserem MuK-Studiengang in Augsburg nicht. Da war meine Erfahrung, dass Studierende es honoriert haben, wenn man was Neues ausprobiert hat. Wenn etwas nicht so gut lief, aber Engagement und Interesse an den Leistungen der Studierenden da war, wurde das eigentlich immer nicht nur toleriert, sondern auch als Impuls für eigene Aktivität gesehen. Das ist ganz offensichtlich eine Frage die Kultur und die entwickelt sich nun mal nur sehr langsam.
Ausdruck von Hilflosigkeit
Unter dem Titel „Dauerproblem Gleichstellung“ findet sich in der duz mal wieder ein Beitrag zum Thema Quote – nun für Frauen in der Wissenschaft (hier). „Um sie jedoch zu erreichen, fordern Experten Sanktionsmöglichkeiten über die Drittmittelvergabe“. Frauenquote in der Wissenschaft inklusive Androhung von Sanktionen, natürlich in Form von Geldentzug, was ja bekanntlich immer am wirksamsten ist: Wird das was bringen? Wie wäre es mit einer Männerquote – in Kinderkrippen und Kindergärten, in der Grundschule, in der Altenpflege und überall da, wo man den Männern nach wie vor keine echte Chance eingeräumt hat, sich zu entfalten? Wenn es Frauenquoten gibt, dann bin ich im Gegenzug auch für Männerquoten. Überhaupt: Mädchen sind besser in der Schule und das weibliche Geschlecht insgesamt weniger kriminell etc. Lasst uns also doch den Männern helfen, oder?
Meine persönliche Erfahrung z.B. in Berufungskommissionen ist die: Externe Vorgaben werden formal abgehakt. Manchmal entstehen auch skurrile Diskussionen zum Thema Gleichstellung – als wäre Frausein schon ein Qualitätsmarkmal – natürlich nur formal. Informell ist ja eher das Gegenteil der Fall: Wie viel gewichtiger klingt doch ein Argument, wenn es mit einer lauten und tiefen Stimme vorgetragen wird. Dafür können aber nun die Männer nichts. Da stimmt etwas nicht mit unserer Wahrnehmung, mit unserer Kultur, mit unseren Routinen etc.
Susanne Keil fragt in ihrem Artikel in der duz: „Quotenforderungen sind meist Ausdruck von Hilflosigkeit. Was soll man noch tun, wenn man alles versucht hat?“ Hat man alles versucht? Glaube ich nicht: Ich meine, Ziel müsste es sein, dass Männer UND Frauen ein gemeinsames Leben, vor allem eines mit Kind oder Kindern, so gestalten, dass alle Beteiligten ihre Begabungen und Interessen einbringen können und nicht aufgrund des Geschlechts in eine bestimmte Rolle fallen. Und das gilt für Frauen ebenso wie für Männer. Zudem müssen wir wohl erst noch mühsam lernen, ansozialisierte Urteilsschemata abzulegen, die uns ebenso alle begleiten: Immer noch hat man ein Grinsen im Gesicht, wenn ein Mann unter vielen Frauen am Spielplatz sitzt oder gar im Kindergarten mit „seiner“ Gruppe Ball spielt. Immer noch ist es ein Problem, wenn Frauen in Führungspositionen unangenehme Entscheidungen gegenüber Männern treffen usw.
Was ich sagen will: Meiner Ansicht nach geht das Problem der Ungleichheit von Männern und Frauen auch in der Wissenschaft viel tiefer als dass man dem mit Quoten begegnen kann. Quoten werden immer geschickt umgangen werden können und sie sind ja auch dort sinnlos, wo es z.B. an geeigneten Frauen für eine Position fehlt.
Man liest sogar
In Kürze wird der Wissenschaftsrat auf einer Veranstaltung (hier das Programm) über die Ergebnisse einer Initiative berichten, die bereits 2004 beschlossen wurde. Im Hochschulmagazin duz kann man hier nachlesen, dass es dabei um ein neues Forschungsrating geht – entstanden aus der Unzufriedenheit mit bekannten nationalen und internationalen Verfahren. Diese dienen dazu, Ranglisten zu erstellen, an denen Wissenschaftler wie auch Studierende (und Förderinstitutionen) ablesen können sollen, wie gut eine Universität ist.
Das neue Verfahren des Wissenschaftsrats arbeitet vor allem mit Peer Reviews und kombiniert quantitative mit qualitativen Daten. „Statt nur die Zahl von veröffentlichten Aufsätzen in Fachzeitschriften zu zählen, werden ausgewählte Publikationen von den Gutachtern auch gelesen und bewertet“, so heißt es im besagten duz-Artikel.
Im Pilotverfahren wurden vier Fächer untersucht. Ziel war es unter anderem, die Spezifika der Fächer für ein Rating besser herauszuarbeiten. Der Ranking-Kritiker Richard Münch (Uni Bamberg) war einer der Gutachter in der Pilotstudie, und beschreibt im Artikel den Aufwand als sehr hoch: „Jedes einzelne der 16 Mitglieder der Gutachtergruppe hat im Zeitraum von zwei Jahren etwa drei Monate seiner Arbeitszeit in das Begutachtungsverfahren gesteckt“, so wird er zitiert.
16 mal drei Monaten innerhalb von zwei Jahren für einen Pilotbetrieb mit vier Fächern, das macht zusammen genau vier Jahre Arbeitszeit eines Wissenschaftlers oder eben ein Jahr Arbeitszeit von vier Wissenschaftlern für einen Bruchteil dessen, was an sich Gegenstand eines solchen Ratings wäre. Immerhin kommen dann die so beschäftigten Wissenschaftler nicht zum Forschen, sodass vielleicht der Evaluationsgegenstand ein bisschen kleiner wird. Wenn es das ist, was angestrebt wird (nämlich weniger Forschungsoutput, weil dieser vielleicht eh zu redundant, zu wenig neu o. ä. ist), dann hätte ich da noch ein paar andere Ideen, wie man das erreichen kann: z.B. mehr Zeitinvestition in die Lehre, mehr Personal für Betreuungsleistungen etc.
Um nicht falsch verstanden zu werden: Ich finde es gut, dass man die bisherigen Ranking-Verfahren kritisch hinterfragt. Es ist auch völlig legitim, nach Alternativen zu suchen. Positiv ist, dass man erkannt hat, wie wichtig die Beachtung verschiedener Fächerkulturen ist. Und ich schließe mich auch gerne der Ansicht an, dass die Fachöffentlichkeit und alle interessierten Bürger ein Recht darauf haben, zu erfahren, was an Hochschulen so passiert – also auch in der Forschung. Aber ginge das nicht auch anders? Mit mehr Transparenz, die jeder Wissenschaftler und jede Universität jenseits der bloßen Marketing-Maßnahmen herstellt? Mit mehr echter gegenseitiger und vor allem kooperativ (versus auf Selektion) angelegter Kritik, die der Sache dient?
Außerdem: Glaubt denn jemand ernsthaft, dass Peer Review-Verfahren weniger anfällig für Fehleinschätzungen sind als manipulierbare Zählmethoden? Und was ist mit dem Aufwand? Wie lässt sich das rechtfertigen? Werden, wie der Artikel in der duz an einer Stelle suggeriert, tatsächlich Bund oder Länder die Ergebnisse heranziehen, um schwächeren Hochschulen unter die Arme zu greifen? Kann ich mir nicht vorstellen!
Übrigens: In einem Workshop der GMW 2012 zum Thema E-Science (Programm) habe ich mit Thomas Köhler und Klaus Wannemacher kurz diskutiert, welche Vorteile es hätte, wenn sich Wissenschaftler zu einer Publikationsbegrenzung verpflichten würden – also z.B. nur zwei Artikel im Jahre zu schreiben. Wir sind unter anderem zu dem Schluss gekommen, dass das eine Maßnahme zur Qualitätssteigerung sein und insbesondere den Diskurs über Publikationsinhalte erhöhen könnte. Und genau diesen Diskurs könnte man sicher mindestens parallel zu Reviews mit Selektionscharakter nutzen, um sich Einsicht in die Qualität von Forschung zu verschaffen.
Was wäre, wenn … Akt VII des Blended Talk
Nun ist die GMW 2012 schon wieder vorüber. Anstatt an dieser Stelle nun den Rest des Textes zu posten, verweise ich jetzt auf den GMW-Band, der online hier zugänglich ist. Auf den Seiten 29 bis 40 findet sich der Text zum Gedankenexperiment – natürlich in der Gänze.
Im „Blended Talk“ zum Gedankenexperiment über Prüfungen haben mich Beat und Petra tatkräftig unterstützt. Ihre Überlegungen dazu, was denn wäre, wenn es keine Prüfungen mit Rechtsfolgen mehr gäbe, waren sehr interessant! Ich habe mich gefreut, dass die beiden das mitgemacht haben – vielen Dank an der Stelle nochmal an euch beide! Bei genauem Hinhören wurde aus meiner Sicht bei den drei Varianten deutlich, dass wir alle an mehreren Stellen die Bedingungen geändert haben, unter denen wir unsere Überlegungen ausgeführt haben. Die Zeit war aber viel zu knapp, um das zu explizieren. Zu eng war auch der Zeitrahmen für eine genaue Beantwortung aller vier Fragen.
Wie immer ist man hinterher schlauer und ich würde bezogen auf den „Blended Talk“ sagen, dass man auf jeden Fall einen Workshop (mindestens 90 Minuten) dazu hätte machen müssen. Erst mal wäre es wichtig gewesen, die Methode des Gedankenexperiments auch in der Präsenzsituation ausführlicher darzulegen, damit man „systematisch“ nachdenkt. Das hat vor allem zu zweit oder zu dritt meiner Einschätzung nach großes Potenzial – vielleicht ist das ja auch ein bisschen rübergekommen. Um dieses Potenzial wirklich auszuschöpfen, erscheint es mir notwendig, hier methodisch ausreichend Vorarbeit zu leisten. Da reicht ein kurzer Text vorab sicher nicht.
Sodann hätte jeder von uns mindestens 15 Minuten Zeit haben müssen, um die Fragen unter den definierten Bedingungen ausführlich zu beantworten und zu begründen. Im Anschluss hätte man dann unsere Antworten miteinander vergleichen und diskutieren können, warum wir an welchen Stellen zu ähnlichen oder eben verschiedenen Antworten gekommen sind. Schließlich wäre es sehr fruchtbar gewesen, in einer zweiten Runde die Bedingungen zu ändern, die ich als Autorin ein wenig selbstherrlich festgelegt hatte.
Aber egal: Ich bin froh, das mal ausprobiert zu haben. Und vielleicht lässt sich das oben Gesagte ja auch asynchron nachholen (wobei es da aber wohl wieder Zeitprobleme geben wird). Inhaltlich, also bezogen auf das Thema Prüfungen, meine ich nach wie vor, dass ein solches Gedankenexperiment die eine oder andere kreative Idee zur Lösung unserer vielfältigen Assessment-Probleme beitragen oder wenigstens das ein oder andere typische Phänomen im Kontext von Lehre und Assessment in einem anderen Licht oder nachvollziehbarer erscheinen lassen könnte.
Was wäre, wenn … Akt IV des Blended Talk
Morgen beginnt bereits die Preconference der GMW – es werden also schon einige in Wien sein. Die Hauptkonferenz beginnt am Dienstag. Nun ist der GMW-Band ja bereits online – trotzdem kommt jetzt stoisch 😉 der letzte Blog-Post, der dazu beitragen soll, dass der „Vortrag“ am Dienstag-Nachmittag mit dem Titel „Was wäre, wenn es keine Prüfungen mit Rechtsfolgen mehr gäbe“ etwas anders gestaltet werden kann. Die vorhergehenden Akte finden sich (in aufsteigender Reihenfolge) hier, hier und hier. Im Folgenden wird dargelegt, unter welchen Bedingungen das Gedankenexperiment abläuft.
Das Setting des Gedankenexperiments
(1) Prolog: Was ist das Grundsätzliche und Übergreifende in meinem Gedankenexperiment? Welchen Rahmen habe ich gesteckt? Einerseits geht es mir um die Koppelung von Lehren und Lernen, die unter anderem durch Prüfungen behindert, oft genug auch verhindert wird. Didaktisch betrachtet spricht viel dafür, „Prüfungen mit didaktischen Funktionen“ bzw. verschiedenen Formen eines „Assessment for Learning“ mehr und intensiver als bisher in die Lehre zu integrieren und im Gegenzug Prüfungen mit Rechtsfolgen abzuschaffen, die komplexeren didaktischen Szenarien zur Kompetenzförderung nicht gerecht werden. Andererseits geht es mir um die Effizienz im Bildungsalltag von Universitäten, die infolge von Prüfungen denkbar schlecht ausfällt. Ökonomisch betrachtet spricht wenig dafür, Prüfungen mit Rechtsfolgen in der heutigen Form beizubehalten: Anschlusssysteme auf dem Arbeitsmarkt kritisieren Prüfungsergebnisse und Noten, weil sie wenig valide (z.B. inflationär gut) oder nicht aussagekräftig sind, setzen eigene Assessment-Verfahren ein oder fällen falsche Entscheidungen auf der Grundlage von Ziffernnoten (vgl. Lang-von Wins, Triebel, Buchner & Sandor, 2008).
(2) Annahmen: Welche Prämisse liegt meinem Gedankenexperiment zugrunde? Inwiefern sind die Annahmen, welche die Prämisse bilden, kontrafaktisch und dennoch denkbar oder real möglich? Die Prämisse ist: Nehmen wir an, an Universitäten gäbe es keine Prüfungen mit Rechtsfolgen mehr, also keine Prüfungen, die einen Selektionscharakter haben und mit einer Ziffernnote bewertet werden. Nehmen wir weiter an, dass von außen (z.B. Wirtschaft, andere Arbeitgeber) kein prinzipieller Protest gegen diese Abschaffung laut würde, und dass die Ressourcen der Universitäten konstant blieben.
Die erste der formulierten Annahmen, die Kernannahme des Gedankenexperiments, ist einerseits kontrafaktisch: Sie entspricht heute und in unserer Gesellschaft nicht der Wirklichkeit – im Gegenteil: Prüfungen spielen an Universitäten für Studierende und Lehrende eine herausragende Rolle. Gleichzeitig aber ist die Annahme prüfungsfreier Universitäten durchaus denkbar, hat doch z.B. die BAK bereits 1970 die Abschaffung von Prüfungen mit Rechtsfolgen als möglich dargelegt. Auch die anderen beiden Annahmen sind fiktiv bzw. hypothetisch (zumal da man annehmen muss, dass Anschlusssysteme am Arbeitsmarkt Ziffernnoten zumindest als ersten Filter verwenden), aber im Bereich des Möglichen. Zusammen haben die formulierten Annahmen eine gewisse Katalysator-Funktion: Das angestoßene Szenario regt die Vorstellung an und man kann es weiterdenken.
(3) Fragenkomplex: Welche Fragen sollen in meinem Gedankenexperiment beantwortet werden? Meine Fragen lauten: Wie würden Studierende darauf reagieren, wenn es keine Prüfungen mit Rechtsfolgen mehr gäbe? Was würde das für die Lehrenden und für die Verwaltung an Universitäten bedeuten? Welche Alternativen zum Prüfungssystem mit Rechtsfolgen würden sich entwickeln? Welche Rolle würden die digitalen Medien dabei spielen?
Die durch die Annahmen gebildete Prämisse des Gedankenexperiments legen die formulierten Fragen nahe, aber nicht fest: Während sich die erste Frage relativ eng an die gemachte Prämisse anlehnt, ist die letzte Frage nicht zwingend, für meine Zielsetzung aber wichtig. Alternativ hätte man z.B. auch fragen können, ob das mit der Versuchsanordnung geschaffene Szenario überhaupt wünschenswert ist oder nicht und warum es (un-)erwünscht ist, oder welche Reaktionen von außen (Arbeitgeber) kämen.
(4) Bedingungen: Von welchen Bedingungen gehe ich aus? Die Bedingungen, von denen ich bei diesem Gedankenexperiment ausgehe, lassen sich in aller Kürze wie folgt benennen: (1) die Erkenntnis, dass Studierende in der Regel so lernen, wie sie geprüft werden (z.B. Reeves, 2006); (2) die Beobachtung, dass sich die Masse der Prüfungen auf die Abfrage von Kenntnissen beschränkt (z. B. Wannemacher, 2009); (3) die Folgerung, dass die Kompetenz-Rhetorik in Modulhandbüchern mit den Merkmalen heutiger Prüfungen in der Regel wenig gemeinsam haben (z.B. Borgwardt, 2011); (4) die Erfahrung, dass anspruchsvolle Prüfungen mit gegebenen Ressourcen nur schwer zu bewältigen sind (z. B. Müller, 2011); (5) der Grundsatz, dass man die an Universitäten vorhandenen Ressourcen nicht unnötig verschleudern sollte (z.B. Schimank, 2008).
In diesem Rahmen werden sich alle drei Varianten des Gedankenexperiments auf der GMW-Tagung bewegen. Nicht nur ich werde meine Version darstellen, die sich auch im schriftlichen Artikel des GMW-Bandes befindet, sondern auch Petra Grell und Beat Döbeli werden unabhängig von mir eigene Versionen präsentieren. Leider sind 30 Minuten sehr knapp dafür: Jeder von uns wird nur fünf Minuten Zeit haben, denn das Ganze muss ich trotz der Blog-Posts ja doch ein wenig rahmen. Ich bin aber sehr gespannt, denn ich kenne Beats und Petras Versionen auch noch nicht! Bis dann!
Was wäre, wenn … Akt III des Blended Talk
Die GMW rückt näher und ich bin beim dritten von vier Blog-Posts als Vorbereitung auf einen Beitrag zum Thema Prüfungen. In diesem Beitrag geht es um den Versuch, in einem Gedankenexperiment der Frage nachzugehen, was wäre, wenn es keine Prüfungen mit Rechtsfolgen mehr gäbe. Das Vorgehen habe ich hier erklärt; die beiden vorausgegangenen Abschnitte befinden sich hier und hier.
Dieser Akt nun ist SEHR wichtig. Denn man muss sich ja fragen, was ein Gedankenexperiment überhaupt ist! Wenn man sich darüber keine Klarheit verschafft, bleibt das Ganze eine ziemlich windige Sache. Also: Wer Interesse an dem Präsenz-Beitrag am Dienstag-Nachmittag auf der GMW hat: Bitte diesen Abschnitt unbedingt lesen. Ich werde das nämlich am Dienstag nicht wiederholen können. 🙂
Was ein Gedankenexperiment auszeichnet und (nicht) leisten kann
Manchen gilt das Gedankenexperiment lediglich als eine andere Bezeichnung für Gedankenspiele ohne Bezug zur Wissenschaft; andere sehen im Gedankenexperiment eine wissenschaftliche Methode. Eine umfassende Darstellung der Ideen- und Wissenschaftsgeschichte sowie eine kritische Analyse dieser Methode liefert Ulrich Kühne (2005). In seinem Buch erläutert er das Gedankenexperiment in der Naturphilosophie, Psychologie und Logik sowie in der modernen Physik und Wissenschaftsphilosophie. Eine erste theoretische Arbeit über die Methode des Gedankenexperiments stammt aus dem Jahr 1811 vom dänischen Naturforscher Hans Christian Ørsted; in das Vokabular von Naturwissenschaft und Wissenschaftsphilosophie führte Ernst Mach um 1900 den Begriff des Gedankenexperiments ein (Kühne, 2005, S. 21). Seitdem wurde und wird er unsystematisch gebraucht, was unter an-derem daran liegt, dass es zwar viele Beispiele für Gedankenexperimente (aus Naturwissenschaft und Philosophie) gibt, aber kaum genaue Definitionen oder gar methodische Anleitungen. Für Kleining (1986, S. 742 ff.) ist das Gedankenexperiment eine Form des qualitativen Experiments, für das entsprechend alle Techniken (des geplanten Veränderns) verwendet werden können wie bei anderen Formen des Experimentierens. Seel (2007, S. 38) betont, dass Gedankenexperimente letztlich darauf hinauslaufen, mögliche Welten zu konstituieren. Es geht in einem Gedankenexperiment weniger darum, zu eruieren, ob etwas wahr oder falsch ist, sondern darum, ob es möglich oder notwendig ist.
Kaum jemand behauptet, Realexperimente würden durch Gedankenexperimente widerlegt oder überflüssig gemacht werden. Stattdessen wird vor allem deren heuristische Funktion betont: Mit Hilfe von Gedankenexperimenten kann man sich das Unübliche, Andersartige, Unvertraute vorstellen (Engels, 2004, S. 220 f.). „Sinnvoll verstanden sind Gedankenexperimente eine Methode, um argumentative Brücken zwischen weit auseinanderliegenden, logisch zuvor unverbundenen Wissensinhalten herzustellen. Die Brücke wird durch Prinzipien hergestellt. Ausgehend von einem vorhandenen Wissen – Alltagswissen oder fortgeschrittene Theorien – werden qualitative Allgemeinsätze abstrahiert, deren Gültigkeit in einen noch nicht erforschten Anwendungsbereich stipuliert wird“ (Kühne, 2005, S. 390). Festzuhalten ist: Nicht jede Überlegung, die mit „Was wäre, wenn ….“ beginnt, ist ein Gedankenexperiment. Das aber wirft die Frage auf: Wann führt der Satzanfang „Was wäre, wenn ….“ zu einem solchen? Nach Helmut Engels (2004, S. 14 ff.) lässt sich an folgender (oft implizit bleibender) Struktur erkennen, ob man ein Gedankenexperiment vor sich hat:
- Während man bei einem Realexperiment von Hypothesen ausgeht, die man verifiziert oder falsifiziert, liegen einem Gedankenexperiment zunächst einmal eine oder mehrere Annahmen zugrunde, die kontrafaktisch sind, also gegen die Fakten sprechen, aber denkbar sein müssen, prinzipiell auch real möglich sein können und die Vorstellung anregen.
- Neben den Annahmen, welche die Versuchsanordnung bzw. Prämisse bilden, umfasst ein Gedankenexperiment eine Frage oder einen Fragenkomplex, der in Bezug zu den Annahmen steht, ohne direkt daraus ableitbar zu sein.
- Das eigentliche Experiment besteht darin, Überlegungen zur Beantwortung der formulierten Fragen anzustellen. Dabei kann man weitere Bedingungen einbeziehen, z.B. „logische Prinzipien, moralische Normen, Wertentscheidungen, Erkenntnisse der Einzelwissenschaften, Einsichten aus der Lebenserfahrung, lebensweltliches Wissen usw.“ (Engels, 2004, S. 16). Zudem bedient man sich beim Überlegen verschiedener Vorgehensweisen wie z.B. Analogiebildung, hypothetische Verallgemeinerung, Perspektivenwechsel, experimentelle Umkehrung und vieles mehr. Der Ausgang des Experiments ist offen.
- Zu einem Gedankenexperiment gehört schließlich ein größerer Rahmen, der etwas Grundsätzliches oder Übergreifendes beinhaltet. Diesen Rahmen bilden der Prolog am Anfang und der Epilog am Ende.
Daraus ergeben sich insgesamt fünf Schritte für die Umsetzung und Präsentation, an denen ich mich im Folgenden (explizit) bei der Darstellung meines Gedankenexperiments zur (Un-)Entbehrlichkeit von Prüfungen an Universitäten orientieren werde.
Was wäre, wenn … Akt II des Blended Talk
Nachtrag (06.09.2012): So, nun ist es soweit. Der GMW-Band ist jetzt online. Das Lesen der Blog-Beiträge könnt ihr euch jetzt also sparen ;-). Ich werde die letzten beiden dennoch wie geplant die nächsten Tage publizieren – vielleicht mag ja mancher die portionierte Darbietung lieber. 🙂 Schade, dass das nicht vorher besser bekannt gemacht worden ist! Wer in die Session nächste Woche kommen mag: Das eigentliche Gedankenexperiment wollte ich erst in der Präsenz-Situation in aller Kürze präsentieren. Das könnte man jetzt also schon vorab lesen. Macht auch nichts. Denn immerhin werden wir noch zwei andere Varianten haben – und die sind nicht online.
Diesen Blog-Post versteht man nur, wenn man die beiden vorhergehenden gelesen hat. Wer also erst jetzt aus dem Urlaub kommt, bitte erst hier (Worum geht es eigentlich?) und dann hier (Was hat der Beitrag mit dem Motto der diesjährigen GMW zu tun?) nachlesen. Was ich letztlich mache, ist, in verdaulichen Portionen meinen Beitrag für die GMW vorab freizuschalten – mit Ausnahme des eigentlichen Gedankenexperiments selbst, für das dann (zusammen mit Petra Grell und Beat Döbeli) Zeit in der Präsenz-Situation ist. Sollte, wie ich erfahren habe, der GMW-Band nun doch schon mehrere Tage vor der GMW online sein (wäre ja schön, hätte ich aber gerne etwas früher gewusst ;-)), dann sollten diejenigen vielleicht den letzten Abschnitt des Beitrags NICHT lesen, die vorhaben, am Dienstag Nachmittag (11.09.) in Session B.4 zu kommen :-). Nun also zum zweiten Abschnitt/Akt, der langsam zum Zweck des Gedankenexperiments hinführt
Warum Prüfungen offenbar als unentbehrlich gelten
Wenn es um die Kompetenzorientierung an Universitäten geht, tun wir uns in der Regel nicht allzu schwer, didaktische Szenarien zu nennen und erfolgreiche Beispiele für deren Umsetzung zu finden, in denen Studierende tatsächlich handlungsfähiger werden: Problem-, fall- und projektorientierter Unterricht, die Verzahnung von Praktika und Seminaren, Szenarien zur Förderung des forschenden Lernens usw. sind allesamt dazu geeignet, neben Kenntnissen auch Fähigkeiten und Fertigkeiten bis hin zu Haltungen aufbauen zu helfen, was man gemeinhin unter den Kompetenzbegriff subsumiert. Wenn es aber darum geht, Möglichkeiten darzulegen, wie man die so geförderten Kompetenzen auch erfassen und im laufenden Lehrbetrieb abseits spezieller Forschungs- und Entwicklungsprojekte flächendeckend und vor allem umfassend (also nicht nur punktuell) erfassen und bewerten kann, sieht es wesentlich schlechter aus. Zwischen der didaktischen Fantasie und Vielfalt auf der einen Seite (Baumgartner, 2012) und der Realität der Prüfungspraxis auf der anderen Seite liegt eine kaum zu überbrückende Kluft (Huber, 2008, S. 22). Forscher auf dem Gebiet der Hochschuldidaktik und -entwicklung weisen in ihren Beiträgen am Rande stets darauf hin, dass das Prüfungssystem für eine kompetenzori-entierte Lehre ebenso wie für einen Lernkulturwandel mit verändert werden müsse (z.B. Brahm, Jenert & Meier, 2010). Wie das im Einzelnen genau aussehen könnte, beschränkt sich meist auf Beispiele unter günstigen Rahmenbedingungen. Die Prüfungspraxis als solche, wie wir sie heute haben, wird jedenfalls nicht in Frage gestellt.
1970 hat die Bundesassistentenkonferenz (BAK) in ihrer auch heute noch viel beachteten Expertise nach einer Analyse der eklatanten Mängel und Widersprüche des Prüfungswesens, das sich in den letzten vier Jahrzehnten nur wenig geändert hat, klar Position bezogen: Die Autoren der Expertise kommen zu dem Schluss, dass es das Beste wäre, das bestehende System von Prüfungen mit Rechtsfolgen (also Prüfungen, die mit Ziffernnoten einhergehen und letztlich der Selektion dienen) würde sich „auflösen“. Dabei sind Prüfungen mit Rechtsfolgen von Prüfungen zu unterscheiden, die „didaktische Funktionen“ haben. Heute würden wir diese als „Assessment for learning“ bezeichnen. Die Begründung für diese radikale Forderung lautete wie folgt: „Solange nicht eindeutig bewiesen ist, daß die selektierenden Prüfungen hinsichtlich ihres prognostischen Wertes signifikant zuverlässiger sind als der Zufall, muss die Maxime festgehalten werden, daß die hypothetisch möglichen Vorteile der Prüfungen gegenüber dem Zufall die existentiellen Konsequenzen nicht rechtfertigen können, die gegenwärtig mit so unsicheren Entscheidungen verbunden sind“ (BAK, 1970, S. 57). Stattdessen sollten Beratungsangebote sowie Möglichkeiten der Selbstkontrolle Instrumente der Steuerung sein. Ein solcher Vorschlag erscheint heute undenkbar: Ähnlich wie auf dem Schulsektor verbinden wir an Universitäten nicht erst seit Bologna, aber durch diesen Prozess wohl noch verstärkt, den Wunsch nach Qualität und Exzellenz mit Bildungsstandards, die ihrerseits nach einer möglichst „objektiven“ Überprüfung des jeweils erreichten Leistungsstands verlangen. Die Forschungspolitik stärkt mit massiver Förderung der Forschung zur Kompetenzdiagnostik parallel dazu den Glauben an eine wissenschaftliche Vorhersagbarkeit von Leistung und Erfolg.
Aber ist es wirklich so? Können wir ohne Prüfungen an unseren Universitäten nicht lehren und lernen? Würde der Lehrbetrieb zusammenbrechen, würde Hochschulbildung unmöglich werden, wenn wir nicht mehr prüfen würden? Was wäre, wenn es an unseren Universitäten keine Prüfungen mit Rechtsfolgen mehr gäbe? Diese Frage lässt sich in empirischen Studien nicht beantworten. Was wirklich wäre, wenn es keine Prüfungen mehr gäbe, kann man nicht herausfinden, indem man diese Situation künstlich für eine kleine Stichprobe herstellt, deren Mitglieder vor und nach der Studie Prüfungen machen und sich ein Studium ohne Prüfungen gar nicht vorstellen können! Umgekehrt gibt es aktuell wohl kein Bundesland, das es wagen würde, ein solches Realexperiment im Feld zu starten, mit dem man die Frage empirisch beantworten könnte. Ein Ausweg, doch noch zu einer Antwort oder einem Ansatz für mögliche Antworten zu kommen, ist das Gedankenexperiment.
Was wäre, wenn … Akt I des Blended Talk
Wie vor zwei Tagen bereits angekündigt, hier nun der erste Abschnitt meines Beitrags für die GMW „Was wäre, wenn es keine Prüfungen mit Rechtsfolgen mehr gäbe? Ein Gedankenexperiment“. Der zweite folgt am Dienstag.
Was Prüfungen mit Exzellenz in der Lehre zu tun haben
Wann man Lehrveranstaltungen an Universitäten als herausragend, ausgezeichnet, erstklassig, genial, überragend, überwältigend etc. bezeichnen kann – und all diese Synonyme bietet z. B. der Duden für das Adjektiv exzellent an –, darüber herrscht keine Einigkeit. Nicht nur, aber wohl auch dafür verantwortlich ist die Tatsache, dass Exzellenz eine relative Eigenschaft ist: Wenn man nämlich etwas, z.B. ein Lehrangebot, als herausragend bewertet, muss man wissen, aus was, z.B. aus welchem durchschnittlichen Niveau, dieses herausragt. Es kommt also darauf an, welchen Vergleichsmaßstab man bei der Suche und Bescheinigung von Exzellenz in der Lehre heranzieht bzw. welche Kriterien dafür verwendet werden.
Seit der Bologna-Reform und ihrer Umsetzung (im deutschsprachigen Raum) scheint vor allem der Kompetenzbegriff Kriterien für die Exzellenz von Lehre liefern zu können. Zum einen gilt es bereits als Exzellenz-Kriterium, wenn man den Blick auf die resultierenden Kompetenzen bei Studierenden als den „Output“ lenkt anstatt auf die Qualität der Lehrinhalte, deren Aufbereitung und gewählten Aktivierungs- und Betreuungsformen als den „Input“. Es ragt also derjenige heraus, der sich auf das konzentriert, was aus der Lehre „herauskommt“, gegenüber dem, der seine Aufmerksamkeit darauf lenkt, was er in die Lehre „hineinsteckt“. Zum anderen wird es als Exzellenz-Kriterium angesehen, wenn man bei den Ergebnissen von Lehr-Lernprozessen das Können, bzw. genauer: die berufliche Handlungsfähigkeit, fokussiert anstatt das Wissen, das allenfalls eine (nicht einmal sichere) Grundlage von Handeln sein kann. Es ragt also derjenige heraus, der sich anstrengt, Studierende für die (Berufs-) Praxis handlungsfähig zu machen, gegenüber dem, der sich damit begnügt, Studierende zum Denken zu bringen.
Eine Kompetenzorientierung in diesem Sinne kann man nun für die Universitäten als erstrebenswert erachten oder man kann dies begründet kritisieren. Zu welchem Urteil man hier gelangt, dürfte unter anderem auf den Kompetenzbegriff ankommen, dem man sich anschließt (vgl. Reinmann, 2011), aber auch auf die Position zum Zweck und zur Rolle von Universitäten in unserer Gesellschaft, die man vertritt (vgl. Brandt, 2011). Das aber möchte ich an der Stelle nicht diskutieren. Vielmehr möchte ich meinen tiefen Zweifel daran zum Ausdruck bringen, dass diese für die gesamte Exzellenz-Debatte so wichtige Kompetenzorientierung in einem auch nur annährend sinnvollen Zusammenhang mit dem Prüfungssystem an unseren Universitäten steht. Dafür habe ich folgende Gründe:
Auf der einen Seite muss eine Bildungsinstitution, die vorgibt, den „Output“ in den Mittelpunkt des Interesses zu stellen, irgendwie nachweisen, dass sie diesen erbringt, wozu Prüfungen mit Selektions- und Ranglisten-Charakter als adäquates und einziges Mittel erscheinen. Auf der anderen Seite ist genau diese Denkart in Richtung einer „Produktion von Kompetenzen durch die Lehre“ angesichts unserer Erkenntnisse über Lernen und Bildung völlig widersinnig, denn: Lehre kann Kompetenzen nicht „herstellen“ wie ein Produkt. Auf der einen Seite muss eine Bildungsinstitution, die infolge des politischen Willens immer mehr junge Menschen zu einem Studienabschluss führen soll, die im Studium erworbenen Kompetenzen effizient abprüfen, da sie nur sehr begrenzte Ressourcen zur Verfügung hat. Auf der anderen Seite ist ebenso bekannt, wie stark sich Kompetenzen im Sinne von Handlungs- und Problemlösefähigkeit einer einfachen und damit auch effizienten Überprüfung entziehen.
Trotz offensichtlicher Widersprüche dieser Art aber wird getan, als seien die aktuellen Rahmenbedingungen an unseren Universitäten und die bestehende Prüfungspraxis einerseits sowie die versprochene Kompetenzorientierung und angestrebte Exzellenz in der Lehre andererseits problemlos unter einen Hut zu bringen.