Die Beurteilung mündlicher Sprachhandlungen in der Primarschule stellt Lehrpersonen vor besondere Herausforderungen. Die Erstellung von Beurteilungsrastern, die sowohl fair als auch differenziert sind, erfordert ein hohes Mass an Fachwissen und pädagogischer Sensibilität. In diesem Blogbeitrag beleuchte ich die Herausforderungen bei der Erstellung von Beurteilungsrastern, diskutiere die Bedeutung des ‚Constructive Alginments‘ in der Unterrichtsplanung und zeige anhand von Beispielen auf, wie Künstliche Intelligenz (KI) gezielt eingesetzt werden kann, um funktionale Beurteilungsraster zu erstellen. Zudem gebe ich praktische Hinweise zur Formulierung zielführender Prompts. Dieser Artikel bezieht sich auf aktuelle Forschungsarbeiten und enthält ein Quellenverzeichnis zur weiteren Vertiefung.
Herausforderung bei der Erstellung von Beurteilungsrastern
Beurteilungsraster sind essenziell, um die Leistungen von Schülerinnen und Schülern objektiv, transparent und nachvollziehbar zu bewerten. Dennoch scheitern Lehrpersonen in der Praxis häufig an folgenden Punkten:
- Subjektivität und Fairness: Es ist schwierig, objektive und faire Kriterien zu formulieren, die für alle Schülerinnen und Schüler gleichermassen gelten.
- Komplexität der Kriterien: Die Definition von klaren, präzisen und leicht verständlichen Kriterien ist anspruchsvoll, insbesondere wenn gleichzeitig verschiedene Kompetenzbereiche (z.B. sprachliche Ausdrucksfähigkeit, inhaltliche Tiefe) berücksichtigt werden sollen.
- Zeitaufwand: Die Erstellung und kontinuierliche Anpassung von Beurteilungsrastern ist zeitintensiv und kann im hektischen Schulalltag leicht vernachlässigt werden.
- Passung: Aktuelle Lehrmittel im Fach Deutsch stellen zwar Beurteilungsraster zur Verfügung, die zu den Lernumgebungen des jeweiligen Lehrmittels passen, jedoch selten die situative Wirklichkeit im jeweiligen Klassenzimmer einholen. Anpassungen sind nötig, aber für Lehrpersonen nicht immer einfach umzusetzen.
- Lehrpersonenhaltung: Ob und wie Beurteilungsraster auch für formative Beurteilungsmomente genutzt werden und wie lernförderlich dies ist, hängt stark mit der Haltung von Lehrpersonen diesen Formen der Lernbegleitung gegenüber ab (Panadero & Jonsson, 2013).
Leistungsbeurteilung und ‚Constructive Alignment‘
Beobachtungen im Schulalltag zeigen, dass Lehrpersonen häufig erst während des laufenden Unterrichts oder am Ende einer längeren Lehr- und Lernsequenz an Beurteilungsformate und -kriterien denken. Selbst dann, wenn Fragen der formativen und summativen Beurteilung von Anfang an in die Planung einbezogen werden, entstehen die konkreten Beurteilungsraster oft erst gegen Ende der Unterrichtssequenz, in der Regel dann, wenn die Lehrperson (spontan) entscheidet, Leistungen vielleicht entgegen der ursprünglichen Absicht doch noch zu benoten.
Das Konzept des ‚Constructive Alignments‘ (entwickelt von John Biggs, 1996) betont die Notwendigkeit, Leistungsbeurteilung bereits zu Beginn der Unterrichtsplanung zu berücksichtigen. Die gesamte Lernumgebung wird vom Ende her gedacht und entworfen. Lernziele, Lehrmethoden und Bewertungsstrategien stehen im Einklang und bilden eine Lernumgebung „aus einem Guss“. Warum ist dies zentral?
- Klarheit der Lernziele: Wenn die Beurteilungskriterien von Anfang an klar definiert sind, wissen Schülerinnen und Schüler, worauf sie hinarbeiten sollen. Dies erhöht die Transparenz und Zielgerichtetheit des Lernprozesses (Biggs & Tang, 2011).
- Kohärenz des Unterrichts: Ein gut durchdachtes Beurteilungsraster stellt sicher, dass Lehrmethoden und Lernaktivitäten auf die gleichen Ziele ausgerichtet sind. Dies führt zu einer kohärenten und effektiven Unterrichtsplanung (Biggs, 2003).
- Effektivität der Beurteilung: Wenn Beurteilungskriterien von Anfang an feststehen, kann die Leistung der Schülerinnen und Schüler präziser und konsistenter bewertet werden (Biggs, 1996).
Ein Problem im Erreichen von Lernzielen ist die häufig vertretene Ansicht, dass praktisch jede Lernaktivität oder Anforderung zur Benotung beitragen sollte. Wenn etwas nicht zählt, so die Überlegung, lohnt es sich nicht, es zu tun. Wenn sich dieses Klima erst einmal etabliert hat, wissen die Lehrpersonen, dass die Schüler·innen sich nur wenig Mühe geben werden, wenn eine Aufgabe nicht in die Bewertung einfliesst. Die Positionen von Lernenden und Lehrpersonen verstärken sich gegenseitig, so dass eine „Punktesammelmentalität“ entsteht. Die Entwicklung von Beurteilungskompetenz erfordert die formative Selbstbeurteilung und das Feedback von Gleichaltrigen in einem Kontext, in dem es weder Anerkennung noch Strafe für Versuch und Irrtum, Experimentieren oder Risikobereitschaft gibt. Wenn diese als legitime Prozesse des Lernens normalisiert werden sollen, müssen Wege gefunden werden, die Punktesammelmentalität zu unterlaufen. (Sadler, 2009).
Wichtig ist daher, dass Beurteilungsraster nicht nur als Bewertungsinstrumente, sondern auch als Lernwerkzeuge betrachtet werden. Sie bieten den Schülerinnen und Schülern eine klare Orientierung und unterstützen sie dabei, ihre mündlichen Fähigkeiten gezielt weiterzuentwickeln. Dazu müssen Sie aber schon im Lernprozess als Checkliste und in Form formativer Rückmeldeinstrumente regelmässig zum Einsatz kommen. Im Fokus stehen in diesen Momenten nicht die verteilten Punkte und das mathematische Endergebnis, sondern die qualitativen Kriterien und die Möglichkeiten, das kommunikative Ziel auf individuellen Wegen möglichst gut zu erreichen.
Nutzung von KI zur Erstellung von Beurteilungsrastern
Künstliche Intelligenz (KI) kann Lehrpersonen unterstützen, effektive und objektivere Erwartungshorizonte zu formulieren. Folgende Vorteile können – immer unter Voraussetzung eines best-practice-Szenarios – erzielt werden:
- Zeitersparnis: KI kann auf Grundlage von vorgegebenen Kriterien schnell und effizient Beurteilungsraster erstellen (Chen et al., 2020).
- Objektivität: KI kann dazu beitragen, subjektive Verzerrungen zu minimieren und faire Bewertungsstandards zu gewährleisten (Gibson et al., 2020).
- Anpassungsfähigkeit: KI-generierte Raster können leicht an spezifische Anforderungen angepasst und kontinuierlich optimiert werden (Holmes et al., 2019).
Zielführender Prompt zur Erstellung von Beurteilungsrastern
Ein zielführender Prompt zur Erstellung von Beurteilungsrastern sollte klar und präzise formuliert sein. Hier ist ein Beispiel, das Sie direkt kopieren und verwenden können. In diesem Beispiel wurde ChatGPT 3.5 genutzt:
Prompt-Beispiel:
Du bist eine erfahrene Lehrperson und unterrichtest eine 2. Primarschulklasse in der Schweiz. Erstelle einen Erwartungshorizont in Rubrikenform für Vorträge zum Thema „mein Lieblingsbuch“. Die Bewertung soll in einer Tabelle dargestellt werden, mit einer Skala von O bis 3 Punkten für verschiedene Bewertungskriterien. Die Kriterien sollen alle wichtigen Kriterien für eine Präsentation beinhalten und sowohl den inhaltlichen Aspekt, wie die Tiefe und Genauigkeit der Information, als auch formale Aspekte, wie den Aufbau und die Präsentation des Referats. Ergänze zudem spezifische Vorschläge für jedes Kriterium, was für 0, 1, 2 und 3 Punkte erwartet wird. Das Raster soll Lernenden helfen, ihre Kompetenzen optimal weiterzuentwickeln.
ChatGPT generiert folgendes Raster:
| Kriterium | 0 Punkte | 1 Punkt | 2 Punkte | 3 Punkte |
|---|---|---|---|---|
| Inhalt | Keine relevanten Informationen zum Buch. | Einige Informationen, aber ungenau/oberflächlich. | Gute Informationen, aber ausbaufähig. | Umfassende und genaue Informationen. |
| Aufbau und Struktur | Keine klare Struktur erkennbar. | Unklare/falsche Einleitung, Hauptteil, Schluss. | Gute Struktur, aber Verbesserungspotenzial. | Klare und logische Struktur. |
| Präsentation und Vortrag | Unverständlich, leise oder unvorbereitet. | Verständlich, aber wenig überzeugend. | Guter Vortrag, aber noch nicht souverän. | Sicherer und überzeugender Vortrag. |
| Medieneinsatz | Keine Medien verwendet. | Wenige/unpassende Medien. | Guter Einsatz, aber ausbaufähig. | Kreative und passende Medienunterstützung. |
| Sprache und Ausdruck | Unverständlich oder fehlerhaft. | Verständlich, aber verbesserungsfähig. | Gute Sprache, aber noch ausbaufähig. | Klare, präzise und überzeugende Ausdrucksweise. |
| Interaktion mit Publikum | Keine Interaktion oder unsicher. | Wenig Interaktion, aber bemüht. | Gute Interaktion, aber noch ausbaufähig. | Aktive und überzeugende Interaktion. |
| Zeitmanagement | Keine Beachtung der Zeit. | Unzureichendes Zeitmanagement. | Gutes Zeitmanagement, aber Verbesserungspotenzial. | Effizientes Zeitmanagement. |
| Visualisierung und Gestaltung | Keine visuelle Unterstützung. | Einfache oder unpassende Visualisierung. | Gute Visualisierung, aber noch ausbaufähig. | Kreative und ansprechende Gestaltung. |
Spezifische Vorschläge für die Kriterien
- Inhalt:
- 0 Punkte: Keine relevanten Informationen zum Buch. Es fehlen grundlegende Angaben wie Titel, Autor und eine kurze Zusammenfassung.
- 1 Punkt: Einige Informationen sind vorhanden, aber sie sind ungenau oder oberflächlich. Es fehlen wichtige Details oder es gibt einige Ungenauigkeiten.
- 2 Punkte: Die Informationen sind gut und größtenteils vollständig, aber es gibt noch Raum für mehr Details oder tiefere Einblicke.
- 3 Punkte: Die Präsentation bietet umfassende und genaue Informationen. Alle wichtigen Aspekte des Buches werden abgedeckt und klar dargestellt.
- Aufbau und Struktur:
- 0 Punkte: Keine klare Struktur erkennbar. Der Vortrag wirkt chaotisch und unorganisiert.
- 1 Punkt: Der Vortrag hat eine unklare oder falsche Einleitung, Hauptteil und Schluss. Es gibt viele Sprünge und Unklarheiten.
- 2 Punkte: Der Vortrag hat eine gute Struktur, aber es gibt noch Verbesserungspotenzial in den Übergängen und der Logik.
- 3 Punkte: Der Vortrag ist klar und logisch strukturiert, mit einer deutlichen Einleitung, einem gut entwickelten Hauptteil und einem klaren Schluss.
- Präsentation und Vortrag:
- 0 Punkte: Der Vortrag ist unverständlich, die Stimme ist leise oder der Vortragende wirkt unvorbereitet.
- 1 Punkt: Der Vortrag ist verständlich, aber wenig überzeugend. Der Vortragende wirkt nervös oder unsicher.
- 2 Punkte: Der Vortrag ist gut, aber der Vortragende wirkt noch nicht ganz souverän. Die Stimme ist meist klar und verständlich.
- 3 Punkte: Der Vortrag ist sicher und überzeugend. Der Vortragende spricht klar, deutlich und selbstbewusst.
- Medieneinsatz:
- 0 Punkte: Es werden keine Medien verwendet.
- 1 Punkt: Es werden wenige oder unpassende Medien verwendet, die den Vortrag nicht unterstützen.
- 2 Punkte: Die Medien sind gut eingesetzt, aber es gibt noch Raum für mehr Kreativität und Relevanz.
- 3 Punkte: Die Medien sind kreativ und passend eingesetzt und bereichern den Vortrag deutlich.
- Sprache und Ausdruck:
- 0 Punkte: Die Sprache ist unverständlich oder fehlerhaft.
- 1 Punkt: Die Sprache ist verständlich, aber verbesserungsfähig. Es gibt einige Fehler oder die Ausdrucksweise ist wenig präzise.
- 2 Punkte: Die Sprache ist gut, aber noch ausbaufähig. Die meisten Sätze sind klar und korrekt.
- 3 Punkte: Die Sprache ist klar, präzise und überzeugend. Der Vortragende verwendet eine ausdrucksstarke und fehlerfreie Sprache.
- Interaktion mit Publikum:
- 0 Punkte: Keine Interaktion oder die vortragende Person wirkt sehr unsicher.
- 1 Punkt: Wenig Interaktion mit dem Publikum, aber die vortragende Person bemüht sich.
- 2 Punkte: Gute Interaktion mit dem Publikum, aber es gibt noch Raum für mehr Natürlichkeit und Sicherheit.
- 3 Punkte: Der Vortragende interagiert aktiv und überzeugend mit dem Publikum, stellt Fragen und reagiert auf Rückmeldungen.
- Zeitmanagement:
- 0 Punkte: Keine Beachtung der vorgegebenen Zeit. Der Vortrag ist viel zu kurz oder zu lang.
- 1 Punkt: Das Zeitmanagement ist unzureichend. Der Vortrag weicht deutlich von der vorgegebenen Zeit ab.
- 2 Punkte: Gutes Zeitmanagement, aber es gibt noch Verbesserungspotenzial. Der Vortrag weicht leicht von der vorgegebenen Zeit ab.
- 3 Punkte: Effizientes Zeitmanagement. Der Vortrag hält die vorgegebene Zeitvorgabe genau ein.
- Visualisierung und Gestaltung:
- 0 Punkte: Es gibt keine visuelle Unterstützung.
- 1 Punkt: Die Visualisierung ist einfach oder unpassend und unterstützt den Vortrag kaum.
- 2 Punkte: Die Visualisierung ist gut, aber noch ausbaufähig. Sie unterstützt den Vortrag, könnte aber kreativer sein.
- 3 Punkte: Die Gestaltung ist kreativ und ansprechend. Die visuellen Hilfsmittel unterstützen den Vortrag hervorragend und machen ihn anschaulich.
Reflexionsinstrument für Selbstbeurteilungen
Während obenstehendes Raster bereits gut für Fremdbeurteilungen durch die Lehrperson oder Peers genutzt werden kann, ist es sinnvoll, sich auch ein Selbstbeurteilungsinstrument zu erstellen, das auf die verwendeten Handlungsschritte aus dem jeweiligen Lehrmittel bezieht.
Hier ein Beispiel, wie die KI sich in diesem Auftrag auf die Strategiekarte ‚Präsentieren‘ aus dem Lehrmittel SPRACHWELT 1 bezieht. Der Prompt lautet wie folgt:
Die Kinder orientieren sich beim Lernen von Präsentationskompetenzen an Strategiekarten mit den vier Schritten: a) vorbereiten, b) zeigen und sprechen, c) Hilfsmittel, wiederholen und d) darüber nachdenken. Gestalte anhand des von dir erstellten Beurteilungsrasters und den vier hier genannten Strategieschritten einen Beurteilungsbogen für Kinder in der 2. Primarschulklasse, mit Hilfe dessen sie sich selbst beurteilen können. Bei Schritt vier geht es um reflexive Momente: Kinder sollen die Frage beantworten, was sie beim nächsten Mal besser machen können. Der Bogen soll in der Ich-Form gehalten werden.
Die KI generiert folgende Antwort:
Selbstbeurteilungsbogen für meinen Vortrag über „Mein Lieblingsbuch“
Liebe Schülerinnen und Schüler, hier ist euer Beurteilungsbogen, den ihr nach eurem Vortrag über euer Lieblingsbuch ausfüllen könnt. Ihr werdet eure Präsentation in vier Schritten bewerten. Schaut genau hin und überlegt, wie ihr eure Präsentation in Zukunft noch besser machen könnt:
Schritt a) Vorbereiten
| Kriterium | Das habe ich nicht gemacht (0 Punkte) | Das habe ich ein bisschen gemacht (1 Punkt) | Das habe ich gut gemacht (2 Punkte) | Das habe ich sehr gut gemacht (3 Punkte) |
|---|---|---|---|---|
| Inhalt | Ich habe keine Informationen über mein Buch gegeben. | Ich habe nur wenige und ungenaue Informationen gegeben. | Ich habe gute Informationen gegeben, aber es fehlt noch etwas. | Ich habe umfassende und genaue Informationen gegeben. |
| Aufbau und Struktur | Meine Präsentation hatte keine Struktur. | Meine Einleitung, Hauptteil und Schluss waren nicht klar. | Meine Präsentation hatte eine gute Struktur, aber sie könnte besser sein. | Meine Präsentation war klar und logisch strukturiert. |
Schritt b) Zeigen und Sprechen
| Kriterium | Das habe ich nicht gemacht (0 Punkte) | Das habe ich ein bisschen gemacht (1 Punkt) | Das habe ich gut gemacht (2 Punkte) | Das habe ich sehr gut gemacht (3 Punkte) |
|---|---|---|---|---|
| Präsentation und Vortrag | Ich habe unverständlich gesprochen, war leise oder unvorbereitet. | Ich habe verständlich gesprochen, aber nicht sehr überzeugend. | Mein Vortrag war gut, aber ich war noch nicht ganz sicher. | Ich habe sicher und überzeugend gesprochen. |
| Sprache und Ausdruck | Meine Sprache war unverständlich oder fehlerhaft. | Meine Sprache war verständlich, aber verbesserungsfähig. | Meine Sprache war gut, aber ich kann noch besser werden. | Meine Sprache war klar, präzise und überzeugend. |
Schritt c) Hilfsmittel verwenden und wiederholen
| Kriterium | Das habe ich nicht gemacht (0 Punkte) | Das habe ich ein bisschen gemacht (1 Punkt) | Das habe ich gut gemacht (2 Punkte) | Das habe ich sehr gut gemacht (3 Punkte) |
|---|---|---|---|---|
| Medieneinsatz | Ich habe keine Medien verwendet. | Ich habe wenige oder unpassende Medien verwendet. | Ich habe Medien gut eingesetzt, aber es könnte noch besser sein. | Ich habe kreative und passende Medien verwendet. |
| Interaktion mit Publikum | Ich habe nicht mit dem Publikum interagiert. | Ich habe wenig mit dem Publikum interagiert, aber ich habe es versucht. | Meine Interaktion mit dem Publikum war gut, aber es könnte noch besser sein. | Ich habe aktiv und überzeugend mit dem Publikum interagiert. |
| Visualisierung und Gestaltung | Ich habe keine visuelle Unterstützung verwendet. | Meine Visualisierung war einfach oder unpassend. | Meine Visualisierung war gut, aber könnte kreativer sein. | Meine Visualisierung war kreativ und ansprechend. |
| Zeitmanagement | Ich habe die Zeit nicht beachtet. | Mein Zeitmanagement war unzureichend. | Mein Zeitmanagement war gut, aber könnte noch besser sein. | Mein Zeitmanagement war effizient und genau. |
Schritt d) Darüber nachdenken
- Was habe ich gut gemacht?
Schreibe hier auf, was du an deinem Vortrag besonders gut fandest: - Was kann ich beim nächsten Mal besser machen?
Schreibe hier auf, was du beim nächsten Vortrag anders oder besser machen möchtest:
Wichtige Überlegungen
Zusätzlich zur Nutzung von KI und der Berücksichtigung des ‚Constructive Alignments‘ gibt es weitere wichtige Aspekte, die Lehrpersonen beachten sollten:
- Feedbackkultur: Ein Beurteilungsraster sollte nicht nur der Bewertung dienen, sondern auch als Grundlage für konstruktives Feedback genutzt werden (Hattie & Timperley, 2007).
- Schülerbeteiligung: Involvieren Sie die Schülerinnen und Schüler in den Prozess der Erstellung von Beurteilungskriterien, um deren Verständnis und Akzeptanz zu fördern (Panadero & Brown, 2017).
- Fortbildung: Lehrpersonen sollten kontinuierlich fortgebildet werden, um aktuelle Methoden und Technologien zur Leistungsbeurteilung effektiv nutzen zu können (Tondeur et al., 2017).
Durch die Berücksichtigung dieser Aspekte und die gezielte Nutzung von KI können Lehrpersonen die Qualität ihrer Beurteilungsraster verbessern und somit einen positiven Einfluss auf den Lernprozess ihrer Schülerinnen und Schüler ausüben. Der Einbezug von Strategiekarten, Handlungsroutinen und Fokuselementen, die im Lernprozess didaktisch eine Rolle spielten und von den Lehrmitteln häufig bereitsgestellt werden, stellt für die KI kein Hindernis dar.
Quellen
Verwendete KI
OpenAI’s ChatGPT AI language model, Version 3.5, persönliche Kommunikation, 7.05.2024.
Literatur
- Biggs, J. (1996). Enhancing teaching through constructive alignment. Higher Education, 32(3), 347–364.
- Biggs, J. (2003). Teaching for quality learning at university. Open University Press.
- Biggs, J., & Tang, C. (2011). Teaching for quality learning at university: What the student does. McGraw-Hill Education.
- Boud, D., & Falchikov, N. (2006). Aligning assessment with long-term learning. Assessment & Evaluation in Higher Education, 31(4), 399–413.
- Chen, X., Xie, H., & Hwang, G. J. (2020). A multi-perspective study on artificial intelligence in education: Grants, conferences, journals, software tools, institutions, and researchers. Computers and Education: Artificial Intelligence, 1, 100005.
- Gibson, D., Webb, M., & Geest, E. (2020). Fostering fairness in AI-based assessment: What educators need to know. Computers & Education, 146, 103751.
- Hattie, J., & Timperley, H. (2007). The power of feedback. Review of Educational Research, 77(1), 81–112.
- Hausser, S. (2023). Mündlichkeit in der Grundschule: Methoden und Werkzeuge. Pädagogische Hochschule Zürich.
- Holmes, W., Bialik, M., & Fadel, C. (2019). Artificial Intelligence in Education: Promises and Implications for Teaching and Learning. Center for Curriculum Redesign.
- Panadero, E., & Brown, G. T. L. (2017). Teachers’ reasons for using self-assessment: A survey self-report of Spanish teachers. Assessment in Education: Principles, Policy & Practice, 24(3), 317–340.
- Panadero, E., & Jonsson, A. (2013). The use of scoring rubrics for formative assessment purposes revisited: A review. Educational Research Review, 9, 129–144.
- Sadler, D. R. (2009). Transforming holistic assessment and grading into a vehicle for complex learning. The SAGE Handbook of Performance Learning and Assessment, 57–75.
- Tondeur, J., van Braak, J., Ertmer, P. A., & Ottenbreit-Leftwich, A. (2017). Understanding the relationship between teachers’ pedagogical beliefs and technology use in education: A systematic review of qualitative evidence. Educational Technology Research and Development, 65, 555–575.