Decision trees with data cards

Apfel oder Popcorn? Eine enaktive Einführung in KI, maschinelles Lernen und Entscheidungsbäume mit Datenkarten

Core idea

In dieser Unterrichtsreihe geht es darum Schülerinnen und Schülern (SuS) eine Vorstellung von maschinellem Lernen und Künstlicher Intelligenz zu vermitteln. Dies wird anhand von datenbasierten Entscheidungsbäumen erarbeitet. Die Umsetzung in dieser Reihe basiert hauptsächlich auf unplugged Materialien, die das handlungsorientierte Lernen auf enaktiver Ebene ermöglichen. Dies wird ergänzt durch eine digitale Lernumgebung, die zum Ende der Reihe flexibel einsetzbar ist. Der ausgewählte Kontext „Lebensmittel“ ist für alle SuS relevant und insbesondere auch für jüngere SuS geeignet.

Lebensmittel kann man anhand von Nährwertangaben als “eher empfehlenswert” oder “eher nicht empfehlenswert” klassifizieren. Dabei müssen mehrere Merkmale wie Fettgehalt, Zuckergehalt und Kalorien berücksichtigt werden. Ein mehrstufiges Regelsystem, mit dem solche Klassifikationen durchgeführt werden können, sind sogenannte Entscheidungsbäume (engl. decision trees). Solche Entscheidungsbäume kann man basierend auf Daten erstellen. Mit Daten ist hier gemeint: Man geht von einer Menge von Lebensmitteln aus, zu dem Nährwertangaben bekannt sind, und zu denen man weiß, ob sie eher empfehlenswert oder nicht empfehlenswert sind. Darauf aufbauend kann man “manuell” schrittweise Entscheidungsbäume erstellen, die die Lebensmittel zunehmend fehlerfreier klassifizieren. Dieser Erstellungsprozess kann auch automatisiert werden, um nach bestimmten Kriterien optimale Entscheidungsregeln zu finden. Die Automatisierung erfordert, jedes Lebensmittel als “Datenkarte” – das ist eine Liste von Zahlenwerten zu den verschiedenen Nährwertmerkmalen – digital zu repräsentieren. Ein maschinelles Lernverfahren entwickelt zu diesen Daten einen passenden (daten-basierten) Entscheidungsbaum. In der Praxis sind neben Entscheidungsbäumen auch andere Typen von Klassifikatoren – z.B. neuronale Netze – im Gebrauch, mit darauf angepassten maschinellen Lernverfahren.

Entscheidungsbäume haben den Vorteil, dass sie als Regelsystem von SuS verstanden werden können, ebenso können die Erstellungsverfahren eines Baumes zunächst manuell erarbeitet und dann am Computer automatisiert werden. Im Unterricht werden Lebensmittel zunächst als reale Datenkarten modellhaft repräsentiert und die SuS können Karten sortieren und klassifizieren, um sich auf einer enaktiven Ebene Verfahren anzueignen. Der Anspruch ist, einen Einblick “in den Maschinenraum” des maschinellen Lernens zu gewinnen und nicht nur vorgegebene Systeme, die eine völlige Black-Box bleiben, als Klassifikatoren mit Daten zu trainieren.

In dieser Unterrichtsreihe wird in ca. 9 Unterrichtsstunden in datenbasierte Entscheidungsbäume eingeführt. Dabei steht im Vordergrund, wie ein Entscheidungsbaum aufgebaut ist und wie die passenden Entscheidungsregeln datenbasiert hergeleitet werden. Dieser systematische, datenbasierte Erstellungsprozess kann dann als eine Methode des maschinellen Lernens automatisiert erfolgen und ein resultierender Entscheidungsbaum kann als eine Form künstlicher Intelligenz bezeichnet werden. Dazu erstellen SuS manuell mit Hilfe von Datenkarten eigene Entscheidungsbäume, um zu verstehen, erstens wie ein Entscheidungsbaum als Regelsystem aufgebaut ist, und zweitens wie man systematisch bei der Konstruktion vorgehen kann, um Entscheidungsbäume mit möglichst geringer Fehlklassifikationsanzahl zu erhalten. Ergänzend gibt es eine vorbereitete digitale Lernumgebung, in der SuS Entscheidungsbäume automatisiert erstellen können. Dabei lernen sie etwas über Künstliche Intelligenz und maschinelles Lernen. Sie lernen Entscheidungsbäume als gewinnbringende Repräsentation von Daten kennen, mit deren Hilfe Erkenntnisse gewonnen und Vorhersagen getroffen werden können, bei deren Anwendung aber auch Fehler passieren können.

Auf fachlicher Basis der deutschen Gesellschaft für Ernährung (DGE) wird das Thema Ernährung aufgegriffen, welches in der Sekundarstufe I behandelt werden sollte, aber aktuell in den Lehrplänen der verschiedenen Fächer unterrepräsentiert ist. Auf diese Weise wird das Thema maschinelles Lernen mit einem bildungsrelevanten Sachthema verknüpft. Der Kontext ist nicht typische für den Bereich KI und maschinelles Lernen, eignet sich aber für die Anbindung an die Erfahrungswelt aller SuS (unabhängig von Alter, Geschlecht, etc.). Es gibt dazu Verknüpfungsmöglichkeiten z. B. zum Biologieunterricht und die Behandlung des Kontextes kann einen Beitrag zu allgemeinbildendem Unterricht darstellen.

Target group

Informatik in Klasse 5 und 6 (alle Schulformen) – Anknüpfung an Biologie- und Mathematikunterricht möglich.

Empfehlung: Ab Klasse 6

Inhaltsfeld

“Künstliche Intelligenz und maschinelles Lernen” (insbesondere der Schwerpunkt: überwachtes Lernen mit Entscheidungsbäumen), “Daten und Information”

Prior knowledge

Basiskenntnisse über Nährwertangaben sind wünschenswert, entsprechende Erklärungen könnten aber auch in diesem Modul integriert werden

Time scope

 8 to 10 lessons of 45 minutes each

Goals

Bezogen auf Datenkarten Entscheidungsbäume:

Die SuS…

  • können einen Entscheidungsbaum als Regelsystem zum Klassifizieren von Objekten anwenden.
  • verstehen eine Datenkarte als Repräsentation eines Objekts, auf dem die Ausprägungen verschiedener Merkmale dieses Objekts erfasst sind.
  • erstellen Entscheidungsregeln zum Klassifizieren von Objekten hinsichtlich eines (Ziel-)Merkmals systematisch basierend auf Daten (in Form einer Sammlung von Datenkarten), d. h. basierend auf den Ausprägungen anderer (Prädiktor-)Merkmale der Objekte.
  • präsentieren und reflektieren eigene Entscheidungsbäume angemessen.
  • verstehen die Rolle von Daten als Grundlage für die Erstellung von Entscheidungsbäumen.
  • verstehen, dass Entscheidungsbäume Prognosen liefern sollen (Klassifikationen neuer Objekte) und deshalb mit neuen Daten getestet werden müssen und dass dabei Fehler in Form falscher Prognosen auftreten können.
  • bewerten Entscheidungsbäume anhand der Anzahl falsch klassifizierter Objekte in einem Datensatz.
  • beschreiben anhand ihrer manuellen Erfahrungen mit Datenkarten, wie ein Computer Entscheidungsbäume automatisiert erstellen kann und identifizieren diesen Vorgang als maschinelles Lernen.
Bezogen auf den Inhalt Lebensmittel:

Die SuS…

  • lernen die Bedeutung einzelner Nährwertangaben (Merkmale) bei Lebensmitteln und ihre Relevanz für die Qualitätsbewertung von Lebensmitteln kennen.
  • leiten aus den gegebenen Nährwertdaten ein Regelsystem ab, das Prognosen darüber trifft , ob ein (neues) Lebensmittel eher empfehlenswert oder eher nicht empfehlenswert ist.

Leitfragen

  • Wie kann man anhand der Nährwertangaben einen Entscheidungsbaum konstruieren, der die Beurteilung unterstützt, ob ein Lebensmittel eher empfehlenswert oder eher nicht empfehlenswert ist?
  • Wie kann man einen Entscheidungsbaum für dieses Problem automatisiert (durch maschinelles Lernen) erstellen lassen?

Lesson overview

Teil 1: Einführung in den Kontext KI und Problematisierung
Phase Content Material
1

Zwecke der Phase

  • SuS werden motiviert, herausfinden zu wollen, wie eine KI funktioniert.

  • SuS gewinnen erste Erkenntnisse über KI-Systeme und maschinelles Lernen:

      • Ein Beispiel für KI-Systeme sind Klassifikatoren: Sie können Objekte einer Klasse zuordnen.

      • Für maschinelles Lernen benötigt man Trainingsdaten: Das sind Beispiele mit dem passenden Label einer Klasse.

Kernaktivität der Phase

  • Die Lehrkraft demonstriert kurz Google Quick Draw (https://quickdraw.withgoogle.com/), ein fertiges KI-System, das Bilder klassifizieren kann.

      • Arbeitsauftrag: Alle SuS malen sechs Objekte, die die KI zu erkennen versucht. Die Webseite ist nach Aufrufen des Links selbsterklärend. (20 min)

  • Wichtige Aspekte für die anschließende Besprechung im Plenum mit Präsentation 1:

      • Folie 2: Funktionsweise der KI besprechen: Die KI klassifiziert die Objekte korrekt, wenn sie passend gezeichnet werden.

      • Folien 3-4: Die KI nutzt Trainingsdaten: Nach dem Klassifizieren wurde automatisch eine Übersicht angezeigt, was erkannt bzw. nicht erkannt wurde. Außerdem werden einige Beispiele gezeigt, die andere Personen zum gleichen Objekt gemalt haben, um die Datenbasis zu veranschaulichen, auf deren Grundlage die gemalten Objekte klassifiziert wurden. Hier wird der Fachbegriff Label eingeführt.

      • Folie 5: Motivieren der Leitfragen der Unterrichtsreihe: Wie können KI-Systeme Objekte klassifizieren? Welche Rolle spielen Daten und maschinelles Lernen dabei?

  • Für weitere Hintergrundinformationen siehe Dokument Informationen 1 zu dieser Phase.

Wortspeicher: KI, Maschinelles Lernen, Objekt, Klasse, Label, Merkmal

Phase Content Material
2

Falls man einen vertieften Einstieg in das Thema Lebensmittel machen möchte, findet man in den Dokumenten Information 2 and Nutri-Score.pdf dazu Anregungen. Dies ist optional. Es kann sich außerdem eine Kooperation mit dem Biologieunterricht anbieten.

Phase Content Material
3

Zwecke der Phase

  • in Klassifikationsproblem für Lebensmitteldaten wird aufgeworfen. Es soll unterschieden werden zwischen „eher empfehlenswerten” und „eher nicht empfehlenswerten” Lebensmitteln.

  • Der Trainingsdatensatz für den weiteren Gebrauch in der Unterrichtsreihe wird hergestellt und im Plenum konsentiert.

  • Eine Verknüpfung zur Leitfrage der Unterrichtsreihe wird hergestellt. Thema dieser Unterrichtsstunden ist, wie ein KI-System als Klassifikator basierend auf Daten erstellt werden kann. Dies wird am Beispiel von Lebensmitteldaten und dem aufgeworfenen Klassifikationsproblem erarbeitet.

Kernaktivitäten der Phase

  • Die Lehrkraft leitet die Problemstellung „Lebensmittel klassifizieren” ein und stellt einen Bezug zum vorher erkundeten Klassifikationsproblem her. Das Ziel des Ganzen ist, dass aus den Nährwertangaben ein Regelsystem von den SuS erstellt wird, mit dem entschieden werden kann, ob ein Lebensmittel „eher empfehlenswert“ oder „eher nicht empfehlenswert“ ist. Folgende Punkte sind dabei wichtig:

      • Genau wie wir es bei Quickdraw gesehen haben, benötigen wir eine Menge an Objekten, die schon passende Label. haben. Im Beispiel der Lebensmittel sind es keine gemalten Bilder, sondern Lebensmittel mit Daten und mit einem Label „eher empfehlenswert“ oder „eher nicht empfehlenswert“. Wir nennen die Sammlung von Lebensmitteln mit Label: Trainingsdaten.

      • Basierend auf den Trainingsdaten wollen wir dann selbst ein System herstellen, das diese Lebensmittel möglichst fehlerfrei klassifiziert.

      • Später diskutieren wir, wie Maschinen solche Systeme herstellen können.

  • Die Lehrkraft formuliert die Aufgabe für diese Phase: Wir stellen solche Beispiele mit Label (=Trainingsdaten) gemeinsam her, um damit später unser KI-System zu trainieren.

      • Die SuS bearbeiten in Partnerarbeit Arbeitsblatt 1, auf dem Bilder der Lebensmittel abgebildet sind. Sie vergeben Label basierend auf ihren eigenen Erfahrungen und entscheiden, welche Lebensmittel sie für eher empfehlenswert halten und welche sie für eher nicht empfehlenswert halten.

      • Wenn alle SuS AB 1 fertiggestellt haben, werden die Kartenspiele in der Klasse verteilt. Ein Kartenspiel sowie je 50 grüne und rote Büroklammern pro Paar werden ausgegeben.

      • In einer anschließenden Plenumsbesprechung wird ein allgemeiner Konsens hergestellt, welche Nahrungsmittel welche Label erhalten. Dabei werden nur die blauen Karten im Deck verwendet, da diese für die Trainingsdaten vorgesehenen sind. Die gelben Karten werden erst später als Testdaten relevant.

      • Jedes SuS-Paar labelt seine Karten entsprechend mit den farbigen Büroklammern.

Didactic notes

Für das Konsentieren des Kartensatzes in Daten mit Label hat sich ein stringentes Vorgehen als sinnvoll in mehreren Erprobungen herausgestellt. Dazu ein Vorschlag:

Alle Karten werden einzeln nacheinander durchgegangen (Lehrkraft hält Karte hoch, alle SuS nehmen die gleiche Karte), um gemeinsam die Label (Büroklammern) an die Karten zu heften. Ablauf:

  1. Jedes SuS-Paar bekommt ein Kartenspiel. Die Karten sollten auf jeden Fall in der Reihenfolge bleiben, wie sie in der Schachtel sind, damit alle SuS die Karten in der gleichen Reihenfolge vorliegen haben.

  2. Im Plenum wird besprochen und festgelegt, welches Label die erste blaue Datenkarte (Haselnussschnitte) bekommen soll. Zunächst kann einfach abgestimmt werden. Wenn keine klare Mehrheit zustande kommt, wird diskutiert.

  3. Falls Einigkeit erzielt wird, stecken alle SuS eine passend farbige Büroklammer an die Datenkarte. Falls auch nach der Diskussion keine Einigkeit erzielt wird, kann die Karte beiseitegelegt werden (diese wird in Phase 6 als neues Objekt verwendet).

  4. 2. und 3. werden für alle blauen Karten wiederholt.

Leitung der Diskussion: Die Lehrkraft kann die Diskussionen im Plenum moderieren und ggf. bei groben Fehleinschätzungen (z. B. Gurke als „eher nicht empfehlenswert”) eingreifen. Eine Orientierung liefert die Datei Rumpfdatensatz_28.csv, in der die besonders eindeutig zuzuordnenden Lebensmittel zu finden sind. Einzelne Abweichungen von diesem Vorschlag sind aber nicht weiter schlimm, d. h. die Diskussion muss nicht strikt geleitet werden. In vielen Unterrichtserprobungen hat sich gezeigt, dass per Mehrheitsvotum der Großteil der Lebensmittel wie im Vorschlag von SuS zugeordnet wird. Zur Weiterarbeit empfehlen sich ca. 30 Karten mit Label zu versehen (etwa 10 Karten können beiseitegelegt werden). Die Karten aus Rumpfdatensatz_28.csv sollten größtenteils enthalten sein, um in der Weiterarbeit gute Ergebnisse zu erzielen.

AB 1 kann im späteren Unterrichtsverlauf als Erinnerung dienen, welche Karte in welcher Farbe gelabelt wurde, falls zwischen den Unterrichtsstunden Label von den Karten abgefallen sind.

Für weitere Hintergrundinformationen siehe Dokument „Informationen2“ zu dieser Phase.

Zum Aufbewahren der Karten eignet sich pro Gruppe ein großer Briefumschlag, eine Klarsichthülle oder ein Schuhkarton. Es lohnt eine Beschriftung mit den Namen der SuS.

Wenn die Büroklammern von den Karten beim nächsten Herausholen der Karten abgefallen sind, kann AB1 als Referenz genutzt werden, um wieder die korrekte Büroklammer an eine Karte zu heften. Deshalb sollten überzählige Büroklammern mit aufbewahrt werden.

Wortspeicher: Daten, Beispiel, Objekt, Label, Trainingsdaten

Phase Content Material
4

Zwecke der Phase

  • Ein Vokabular zum Sprechen über Daten am Beispiel Lebensmittel wird eingeführt. Dazu begreifen wir Nährwertangaben als Ausprägung von Merkmalen von Lebensmitteln. Somit kann ein Lebensmittel durch eine Liste von Daten (Zahlen als Nährwertangaben) repräsentiert werden.

  • Das Aufstellen einer Entscheidungsregel anhand von Daten wird eingeführt, um Lebensmittel zu klassifizieren. Dafür werden folgende wichtige Konzepte eingeführt: Datensplit, Mehrheitsentscheidung, Fehlklassifikation, Darstellung als Entscheidungsbaum(-diagramm). (Hintergrundinformationen sind im Reiter “Tools + Daten” zu finden)

Kernaktivität der Phase

  • Die Lehrkraft leitet ein, dass für das gemeinsame Arbeiten ein gemeinsames Vokabular benötigt wird und erläutert an einer Datenkarte die Begriffe Objekt, Merkmal, Ausprägung und Label.

  • SuS bearbeiten zu den Begrifflichkeiten das worksheet 2.

  • Besprechen von Arbeitsblatt 2

  • Anschließend wird das Aufstellen von Entscheidungsregeln eingeführt anhand von presentation 2

      • Die Lehrkraft gibt folgenden Impuls: “Vielleicht kann man schon mit einem Merkmal ganz gut vorhersagen, ob das Lebensmittel empfehlenswert ist oder nicht. Wir probieren einen kleinen Datensatz aus und schauen nach dem Merkmal Energie. Um einen Überblick zu bekommen, ordnen wir die Karten nach Energie.“ 

      • Um dies zu zeigen, nutzt die Lehrkraft Präsentation 2 . In Präsentation 2 wird ein Minibeispiel mit 6 Lebensmitteln gezeigt. Im gezeigten Beispiel wird zuerst der Optimalfall dargestellt, dass in beiden Teildatensätzen alle Label die gleiche Farbe haben.

      • Entdeckung: Ab einem gewissen “Schwellenwert” sind alle Karten über dem Schwellenwert nicht empfehlenswert. Anhand des Schwellenwerts wird ein “Datensplit” durchgeführt (Einteilung in zwei Gruppen) und die naheliegende Entscheidungsregel wird formuliert. 

      • Die Lehrkraft hält fest, dass diese perfekte Trennung in empfehlenswert und nicht empfehlenswert die Zielstellung für einen Datensplit ist, die aber nicht durch jeden Datensplit erreicht wird.

      • Anschließend wird mit zwei zusätzlichen Lebensmitteln ein Beispiel gezeigt, bei dem man eine Entscheidungsregel nur so aufstellen kann, dass auch manche Lebensmittel falsch klassifiziert werden. Dies ist der Normalfall. An diesem Beispiel werden die Mehrheitsentscheidung und der Begriff Fehlklassifikation eingeführt. Ziel ist es, mit einer Entscheidungsregel möglichst wenig Fehlklassifikationen zu erreichen.

  • Das vorher in der Präsentation gesehene wird nun durch eine Aktivität vertieft. Es wird im Plenum eine Lebendige Statistik durchgeführt, um die Entscheidungsregel aus Präsentation 2 mit noch mehr Daten zu überprüfen. Dabei werden die Konzepte Datensplit, Schwellenwert, Mehrheitsentscheidung in den beiden Teildatensätzen and Fehlklassifikation vertieft und gefestigt. Alle SuS repräsentieren je eine Lebensmittelkarte, indem sie sie festhalten(d. h. es werden so viele Karten genutzt, wie SuS in der Klasse sind). Es wird der Datensplit aus der vorherigen Präsentation betrachtet (Energie, Schwellenwert 260 kcal). Für die genaue Durchführung der Lebendigen Statistik siehe Informationen 3. Die Lehrkraft notiert den resultierenden einstufigen Entscheidungsbaum an der Tafel.

  • Die SuS gehen zurück an ihre Plätze und im Plenum wird gemeinsam anhand der Dokumentation an der Tafel für den Entscheidungsbaum die Anzahl der Fehlklassifikationen ermittelt. 

  • Eine anschließende Besprechung dient als Zusammenfassung der bisherigen Phase und als Ausblick auf weitere Inhalte der Unterrichtsreihe. Folgende Punkte sollten in der Diskussion vorkommen:

    • Eine einzelne Entscheidungsregel ist ein kleiner Entscheidungsbaum mit nur einer Ebene.

    • Wichtige gelernte Inhalte bisher sind die Schritte zur Aufstellung einer Entscheidungsregel:

        • Ein Datensplit basiert auf einem bestimmten Merkmal und einem Schwellenwert  

        • In den Teildatensätzen geschieht eine Mehrheitsentscheidung

        • Auszählen von falsch klassifizierten Lebensmitteln (= Anzahl der Fehlklassifikationen)

    • Der Entscheidungsbaum ist schon einmal ganz gut, da er nur wenige Fehler macht. In der nächsten Phase werden nun noch mehr einstufige Entscheidungsbäume überprüft, um den besten zu finden.

    • Später werden noch weitere Ebenen von Entscheidungsregeln dazukommen. Die Bäume werden “wachsen”.

  • Hausaufgabe:

 Wortspeicher: Objekt, Merkmal, Merkmalsausprägung, Label, Klassifikation, Schwellenwert, Datensplit, Anzahl der Fehlklassifikationen

Phase Content Material
5

Zwecke der Phase:

  • Das Aufstellen einer Entscheidungsregel mit Hilfe von Datenkarten wird eingeübt. Dabei werden die Konzepte Datensplit, Schwellenwert, Mehrheitsentscheidung vertieft.

  • Das Vergleichen von Entscheidungsregeln wird eingeübt. Dabei wird das Konzept Fehlklassifikation vertieft.

  • SuS lernen eine Heuristik kennen, wie man bei einem vorgegebenen Merkmal einen günstigen Schwellenwertauswählt, um eine Entscheidungsregel aufzustellen.

Kernaktivitäten der Phase

Aktivität 1: Vorgehensweise für das Finden guter Schwellenwerte erarbeiten

  • Als erster Schritt wird das Sortieren von Datenkarten als Hilfsmittel eingeführt. Durch das aufsteigende Sortieren können schnell verschiedene Datensplits ausprobiert werden, ohne dass man immer zwei Haufen von Datenkarten bilden muss (wie in der lebendigen Statistik). Die Linealmethode (siehe Information 4) kann mit sortierten Karten angewandt werden.

  • Die Linealmethode wird im Plenum basierend auf Presentation 3 erarbeitet. Dabei kann man schon Strategiehinweise geben, wie man einen Schwellenwert per Augenmaß (siehe Dokument Information 4) wählen kann.

  • Anhand von Worksheet 4 wird die Linealmethode in Einzelarbeit eingeübt, um die Methode danach in Kleingruppen mit den Datenkarten anzuwenden.

  • Im Plenum werden die Ergebnisse von AB4 verglichen und ggf. korrigiert. Die SuS können ihre Begründungen vortragen und diskutieren. Bei der Besprechung sollte insbesondere auf folgende Aspekte geachtet werden:

      • Was ist ein Kriterium für einen „besten“ Schwellenwert? (Anzahl falsch klassifizierte Karten/Fehlklassifikationen)

Aktivität 2: Beste Entscheidungsregel mit Datenkarten suchen

  • In Partnerarbeit arbeiten die SuS je mit ihrem eigenen Kartensatz mit Label. Jedes Paar bekommt von der Lehrkraft ein Merkmal zugeteilt, für das eine Entscheidungsregel gesucht wird. Jedes Merkmal sollte an mindestens ein Paar vergeben werden, um im Nachhinein die Entscheidungsregeln basierend auf allen verschiedenen Merkmalen vergleichen zu können.

      • Aufgabe: Jedes Paar sortiert die Karten nach dem ihm zugeteilten Merkmal, zieht mehrere Schwellenwerte (mindestens drei) in Betracht und begründet, welcher der beste Schwellenwert unter den in Betracht gezogenen ist. Es sollen mindestes drei in Betracht gezogen werden, um das Vergleichen zu üben. Es wird nicht vorausgesetzt, alle mögliche Schwellenwerte zwischen je zwei Karten zu betrachten, weil dies für einige SuS überfordernd sein kann. Optional kann Spielplan 1 als Unterstützung des Prozesses eingesetzt werden. Die Dokumentation erfolgt auf Worksheet 5.

  • Besprechung: Alle Paare präsentieren die jeweils beste gefundene Entscheidungsregel. Dabei werden Merkmal, Schwellenwert und Anzahl der Fehlklassifikationen genannt. Somit wird im Klassenverband die insgesamt beste Entscheidungsregel aus den untersuchten Merkmalen ermittelt und an der Tafel notiert mit Angabe des Schwellenwerts und der Fehlklassifikationen

      • Impuls für eine gemeinsame Besprechung: Was kann ein Computer schneller und besser machen als die SuS? An der Tafel werden Punkte gesammelt. Folgende Punkte sind mögliche Antworten: Ein Computer sucht auch die beste mögliche Entscheidungsregel und zieht dafür alle Merkmale in Betracht.

      • Für jedes Merkmal ermittelt der Computer datenbasiert alle sinnvollen (d. h. zwischen zwei Kartenwerten liegenden) Schwellenwerte und vergleicht diese anhand der Anzahlen der Fehlklassifikationen.

      • Ein Computer kann diese Vergleiche (und Berechnungen) typischerweise sehr schnell durchführen.

  • Was haben wir (SuS) gemachtim Vergleich zu einem Computer?

      • Der Klassenverband hat die Vorgehensweise eines Computers fast vollständig simuliert, weil über alle Gruppen hinweg alle Merkmale betrachtet wurden. Es wurden vermutlich nicht alle möglichen, aber viele der sinnvollen Schwellenwerte betrachtet und verglichen.

      • Der Computer kann diese Prozesse schneller als ein Mensch durchführen. Der Klassenverband hat z. B. eine halbe Stunde benötigt.

 Didaktische Hinweise:

Der Umgang mit den Datenkarten ist zentral in dieser Phase. Um mit Fehlklassifikationen argumentieren zu können und damit die Güte verschiedener Schwellenwerte vergleichen zu können, ist es nötig, die Karten aufsteigend zu sortieren. Es kann nötig sein, dass Paare an zwei aneinander geschobenen Tischen arbeiten, um die Karten vollständig aufsteigend nach einem Merkmal sortieren zu können. Diese Sortierarbeit braucht einiges an Zeit und kann für manche SuS herausfordernd sein, bietet aber eine gute Gelegenheit für die Besprechung, was ein Computer schneller (und genauer) kann als ein Mensch.

Wortspeicher: Datensplit, Schwellenwert, Mehrheitsentscheidung, Entscheidungsregel, Fehlklassifikation, Linealmethode

Phase Content Material
6

Zwecke der Phase

  • Es wird motiviert mehrstufige Entscheidungsbäume zu betrachten, nicht nur einstufige, da alle einstufigen Entscheidungsbäume noch Fehler machen. Außerdem ist eine gute Ernährung multifaktoriell, sodass es Sinn ergibt, mehrere Merkmale heranzuziehen.

  • Die Vorgehensweise beim Erstellen der zweiten Stufe wird erläutert und geübt: Das Vorgehen auf der zweiten Stufe ist im Wesentlichen gleich zur ersten Stufe mit zwei Unterschieden. Auf der zweiten Stufe wird nur mit den Teildatensätze weitergearbeitet, die in der ersten Stufe entstanden sind, und es wird mit anderen Merkmalen als dem der ersten Stufe gearbeitet.

Kernaktivität der Phase

  • Die Lehrkraft motiviert das Betrachten mehrstufiger Entscheidungsbäume wie folgt. Aus der vorherigen Phase ging hervor, dass man mit einstufigen Entscheidungsbäumen nicht alle Lebensmittel korrekt klassifizieren kann. Deshalb werden in dieser Phase basierend auf der ersten Regel weitere Merkmale einbezogen, um Entscheidungsregeln in der zweiten Stufe des Entscheidungsbaums zu erstellen, wodurch der Entscheidungsbaum im Hinblick auf die Anzahl der fehlklassifizierten Lebensmittel verbessert wird.

  • Als wichtige Ergänzung zum einstufigen Entscheidungsbaum wird eingeführt, dass in zweiter Stufe jeweils nur mit den Karten eines Teildatensatzes weitergearbeitet wird (entweder arbeitet man also mit den Karten im linken oder im rechten Ast weiter). Das kann entweder im Plenum mit Unterstützung von Präsentation 4 besprochen werden oder optional durch eine weitere Aktivität in der lebendigen Statistik veranschaulicht werden (siehe Information 5 zu dieser Phase).

  • Anhand von Präsentation 4 erläutert die Lehrkraft die Dokumentation eines mehrstufigen Entscheidungsbaums gemäß worksheet 6.

  • Wieder in Partnerarbeit arbeiten die SuS mit ihrem Kartensatz und erstellen weitere Stufen ihres Entscheidungsbaums. Jedes Paar darf wählen, ob es mit dem eigenen Entscheidungsbaum aus der letzten Phase weiterarbeitet oder den nimmt, der als bester einstufiger Entscheidungsbaum ausgewählt wurde.

  • Nächster Auftrag für die Paare: Verbessert den Baum, indem ihr weitere Stufen anbaut. Wählt dazu geeignete Merkmale aus. Dokumentation erfolgt auf Arbeitsblatt 6. Spielplan Teil 2 kann für die Organisation der Datenkarten genutzt werden, um z. B. nicht genutzte Karten eines Teildatensatzes passend abzulegen. Zur genauen Nutzung des Spielplans siehe Information 5.

      • Zur Differenzierung für schnelle Gruppen: Weitere Verbesserungen durch Veränderung des Baumes

          • Differenzierung 1: Eine dritte Stufe des Entscheidungsbaums wird angebaut. Hierfür kann Spielplan Teil 2 genutzt werden, indem „einzelne Datensplits” durch Zerschneiden von Spielplan Teil 2 angelegt werden. Auf AB6 kann eine dritte Stufe des Entscheidungsbaums selbst eingezeichnet werden.

          • Differenzierung 2: Verschiedene Merkmale werden von SuS im zweiten Split ausprobiert.

      • Alle SuS-Paare erstellen mindestens einen zweistufigen Entscheidungsbaum und dokumentieren ihn auf AB6.

  • Im Plenum werden die erstellten, mehrstufigen Bäume präsentiert mit Hinweis auf die benutzten Merkmale, Schwellenwerte und Gesamtanzahl der Fehlklassifikationen. Außerdem werden die Entscheidungsregeln verbal formuliert.

  • Die erstellten Bäume werden anhand des Kriteriums der Anzahl der Fehlklassifikationen miteinander verglichen. Alle Bäume werden wertgeschätzt und die besten drei Bäume (diejenigen mit der geringsten Anzahl an Fehlklassifikationen) werden besonders hervorgehoben.

  • Für die nächste Stunde werden die in dieser Phase erstellten Entscheidungsbäume (AB6) in der Klasse aufgehängt (bzw. durch Lehrkraft eingesammelt). Diese werden in der nächsten Stunde nochmal benötigt, um Testdaten darauf anzuwenden.

  • Hausaufgabe: Alle SuS füllen eine Blankokarte (AB8) für ein neues Lebensmittel zu Hause aus. Diese neuen Lebensmittel werden in der nächsten Stunde mit den erstellten Bäumen klassifiziert. Optional kann als Hausaufgabe auch AB7 bearbeitet werden.

 Didactic notes

Aus mehreren Erprobungen ist bekannt, dass SuS in dieser Phase sehr unterschiedlich schnell arbeiten. Das Ziel sollte es sein, dass alle SuS-Paare einen zweistufigen Entscheidungsbaum erstellen und mit der Anzahl der Fehlklassifikationen auf AB6 dokumentieren.

Ein typischer SuS-Fehler ist es, mit allen Karten in einem Ast weiterzuarbeiten, obwohl nur mit der Teilgruppe der Karten des entsprechenden Asts gearbeitet werden darf.

Wortspeicher: Stufen eines Entscheidungsbaums

Phase Content Material
7

Zwecke der Phase

  • Die SuS benutzen erstmalig explizit einen mehrstufigen Entscheidungsbaum zum Klassifizieren eines Lebensmittels. Dabei erlernen sie das Benutzen des Entscheidungsbaums als Klassifikator.

  • Die SuS wenden unterschiedliche Entscheidungsbäume auf das gleiche Lebensmittel an, um festzustellen, dass verschiedene Entscheidungsbäume als Klassifikatoren unterschiedliche Entscheidungen für das gleiche Lebensmittel treffen können.

  • Es wird motiviert zu überprüfen, welcher Entscheidungsbaum besonders viele neue Lebensmittel korrekt klassifiziert. Dafür werden in der nächsten Phase Testdaten eingeführt.

Kernaktivität der Phase

  • Vorbereitung: Die Lehrkraft legt (oder hängt) die erstellten Bäume (als ausgefüllte AB 6 aus der vorherigen Phase) als Stationen zusammen jeweils mit roten und grünen Büroklammern im Klassenraum aus.

  • Im Plenum wird anhand von Präsentation5_Baum_Anwenden eingeführt, wie man mit einem Entscheidungsbaum anhand einer Lebensmittelkarte ein Lebensmittel klassifizieren kann. Dies bereitet die SuS auf die nächste Aktion vor.

  • Jede:r SuS geht mit dem neuen Lebensmittel (der zu Hause ausgefüllten Blankokarte von AB 8) von Station zu Station. An jeder Station durchlaufen die SuS mit der Karte den jeweiligen Entscheidungsbaum und heften am Ende die passende, farbige Büroklammer an die Karte (je nachdem, ob der Entscheidungsbaum das Lebensmittel als eher empfehlenswert oder eher nicht empfehlenswert klassifiziert). Jedes neue Lebensmittel erhält so eine Vielzahl an Klassifizierungen.

  • Wichtige Aspekte für die gemeinsame Besprechung:

      • Beobachtung: Ein Lebensmittel kann von verschiedenen Bäumen unterschiedlich klassifiziert worden sein, was an den verschiedenfarbigen Büroklammern an einzelnen Karten erkennbar ist.

      • Schlussfolgerung: Verschiedene Entscheidungsbäume können das gleiche Lebensmittel unterschiedlich klassifizieren.

      • Neues Ziel: Wir wollen herausfinden, welcher Entscheidungsbaum Lebensmittel am zuverlässigsten korrekt klassifiziert.

      • Vorgehen: Dies kann durch den Einsatz von Testdaten herausgefunden werden.

Wortspeicher: Testdaten, Klassifikator

Phase Content Material
8

Zwecke der Phase

  • .Die SuS wenden Testdaten auf ihren eigenen Entscheidungsbaum an, um herauszufinden, wie viele der 15 Test-Lebensmittel falsch klassifiziert werden.

  • Die SuS vergleichen verschiedene Entscheidungsbäume anhand der Anzahl der falsch klassifizierten Test-Lebensmittel.

  • Im Klassenverband wird anhand der Testdaten der Entscheidungsbaum mit der geringsten Anzahl falsch klassifizierter Lebensmittel ausgewählt.

Kernaktivität der Phase

  • Die gelben Testkarten werden im Plenum eingeführt und mit Hilfe von (worksheet 9). mit Labeln versehen (wie bereits in Phase 1 für die blauen Trainingsdaten).

  • Jedes SuS-Paar testet mit den Testdaten den eigenen Entscheidungsbaum (Ergebnis aus der vorherigen Stunde auf AB6). Dafür wird jede Testkarte genommen und durch den Entscheidungsbaum klassifiziert. Für jede Karte wird notiert, ob die Klassifikation durch den Entscheidungsbaum mit dem im Plenum gewählten Label an der Karte übereinstimmt.

  • Am Ende kann auf AB6 folgender Satz ergänzt werden: „Mit dem Entscheidungsbaum unserer Gruppe wurden von den Testdaten ___ Lebensmittel richtig klassifiziert und ____ Lebensmittel falsch klassifiziert.”

  • Im Plenum wird verglichen, wie gut die Bäume jeweils mit Testdaten abschneiden. Das Vergleichskriterium ist die Anzahl falscher Klassifikationen durch den Entscheidungsbaum.

  • Abschließend werden im Plenum folgende Aspekte besprochen:

      • Welches sind die drei besten Entscheidungsbäume gemessen an der Anzahl der falsch klassifizierten Test-Lebensmittel?

      • Die Top 3 der besten Entscheidungsbäume gemessen an den Trainingsdaten werden mit den Top 3 der besten Entscheidungsbäume gemessen an den Testdaten verglichen.

          • Aspekt für die Besprechung: Ein Entscheidungsbaum wird mit Trainingsdaten erstellt und für diese optimiert. Wenn man diesen Entscheidungsbaum für neue Daten benutzt, kann es sein, dass er nicht mehr das beste Ergebnis liefert. Daher ist es wichtig, basierend auf Daten erstellte Entscheidungsbäume immer zusätzlich mit Testdaten zu überprüfen.

Didactic notes

Für den Vergleich der Performance eines Entscheidungsbaums auf Trainings- und auf Testdaten wird normalerweise der Anteil falscher Klassifikationen in den Trainingsdaten mit dem Anteil in den Testdaten verglichen. Dies haben wir hier vereinfacht zur absoluten Anzahl an falschen Klassifikationen, um potentielle SuS-Schwierigkeiten beim Vergleich von Dezimalzahlen zu vermeiden.

Phase Content Material
9

Zwecke der Phase

  • Die SuS erarbeiten, wie ein Computer systematisch beim Auswählen von Schwellenwerten vorgeht. Dazu greifen sie auf ihre eigenen Erfahrungen beim Erstellen von Entscheidungsbäumen zurück.

  • Die SuS erstellen einen Entscheidungsbaum, im eigentlichen Sinne des maschinellen Lernens, automatisch mit Hilfe eines Computers und einer digitalen Lernumgebung.

  • SuS reflektieren über Einsatzmöglichkeiten und Grenzen ihrer eigenen Entscheidungsbäume.

Kernaktivität der Phase

  • Im Plenum wird wieder aufgegriffen, was in einer früheren Phase (Ende Phase 4) dazu festgehalten wurde, wie ein Computer einen Entscheidungsbaum automatisiert erstellen kann. Dazu sind folgende Punkte wichtig:

      • Ein Computer sucht zuerst die beste einstufige Entscheidungsregel, zieht dafür alle Merkmale in Betracht.

      • Für jedes Merkmal ermittelt der Computer datenbasiert alle sinnvollen (d. h. zwischen zwei Kartenwerten liegenden) Schwellenwerte und vergleicht diese anhand der Anzahlen der Fehlklassifikationen.

      • Anschließend wird das gleiche Vorgehen in der zweiten (dritten, vierten, …) Stufe wiederholt, sodass sich der Baum nach und nach aufbaut.

      • Ein Computer kann diese Vergleiche (und Berechnungen) typischerweise sehr schnell durchführen, sodass wir nach Sekunden einen mehrstufigen Entscheidungsbaum angezeigt bekommen. Ein Mensch würde dafür viel länger brauchen.

  • Außerdem wird kurz darauf eingegangen, was ein Mensch zu diesem Prozess beitragen muss:

      • Objekte müssen von einem Menschen mit einem passenden Label versehen werden, bevor der Computer damit arbeiten kann.

      • Der Mensch muss dem Algorithmus ein paar „Anweisungen“ geben, wie z. B. die maximale Tiefe des Baums(= Anzahl der Stufen des Baums).

  • Anschließend an diese grobe Wiederholung erarbeiten die SuS noch einmal detailliert, wie ein Computer für ein Merkmal und gegebene Daten alle sinnvollen Schwellenwerte testet und darauf aufbauend entscheidet. Dies wird auf (worksheet 10). bearbeitet und im Plenum besprochen.

  • Nachdem das Vorgehen eines Computer erarbeitet wurde, arbeiten die SuS in einer digitalen Lernumgebung (https://go.upb.de/auto-baum), um Entscheidungsbäume automatisch von einem Computer erstellen zu lassen. Dabei durchlaufen sie vorbereitend verschiedene Schritte, die sie in den Phasen zuvor selbst manuell mit den Datenkarten durchgeführt hatten (Label auswählen, Sortieren, Entscheidungsregeln manuell erstellen). Im Dokument Informationen 8.1 sind weitere Hinweise zum Umgang mit der Lernumgebung zu finden.

  • Im Plenum wird nacheinander über zwei wichtige Aspekte reflektiert (detailliertere Vorschläge in Information 8.2): 

      • Vergleich des Erstellungsprozesses eines Entscheidungsbaums manuell mit Datenkarten und automatisch mit dem Computer

      • Reflexion über Grenzen und Einsatzmöglichkeiten der selbst erstellten Entscheidungsbäume im Hinblick auf eine gesunde Ernährung

Phase Content Material

Bitte um Evaluation

Bitte als Abschluss der Unterrichtsreihe den SuS die Evaluation (Rückmeldung) geben mit dem Hinweis, dass dies eine anonyme Rückmeldung an die „Erfinder:innen“ der Unterrichtsreihe ist. Die „Erfinder:innen“ sind sehr daran interessiert zu erfahren, wie die Reihe den SuS gefallen hat.

Eine Umfrage zur Evaluation findet sich digitalisiert auf einem Server datenschutzrechtlich unbedenklich der Universität Paderborn: https://go.upb.de/ev-lebensmittel 

Herzlichen Dank dafür!

Ast Ein Ast innerhalb eines Entscheidungsbaums ist eine von mehreren Abzweigungen, die von einem Regelknoten zu einem nächsten Knoten führt.

Ausprägung/Merkmalsausprägung Die Werte, die ein Merkmal annehmen kann, nennt man Merkmalsausprägung.

Beispiel (im Kontext von KI) Ein Beispiel ist ein Objekt (z. B. Lebensmittel), das durch bestimmte Merkmale (z. B. Nährstoffe) beschrieben wird und mit einem Label (z. B. „eher empfehlenswert“ oder „eher nicht empfehlenswert“) versehen ist.

Blattknoten Ein Entscheidungsbaum besteht aus verschiedenen Knoten. Die Knoten am Ende eines Entscheidungsbaums nennt man Blattknoten und in ihnen ist immer eine Entscheidung für eine Ausprägung des Zielmerkmals eingetragen.

Datenkarte Eine Datenkarte repräsentiert ein Objekt, indem darauf die Ausprägungen einer Liste von Merkmalen dargestellt sind (z. B. ein Lebensmittel durch Nährwertangaben zu einer Liste von Nährstoffen). Eine Datenkarte kann digital oder analog repräsentiert sein.

Datensplit Ein Datensplit ist die Aufteilung von Daten in Teildatensätze basierend auf den Ausprägungen eines Merkmals, z. B. durch einen Schwellenwert.

Entscheidungsbaum Ein Entscheidungsbaum ist ein (übersichtliches, in gewissen Grenzen nachvollziehbares) Regelsystem, das als Baumdiagramm dargestellt werden kann. Ein solcher Entscheidungsbaum veranschaulicht hierarchisch aufeinanderfolgende Entscheidungsregeln, an deren Ende immer eine Entscheidung für eine bestimmte Fragestellung steht.

Fehlklassifikation Eine Objekt, das durch einen Klassifikator einer falschen Klasse zugeordnet wird nennt man Fehlklassifikation.

Klasse (im Kontext von KI) Eine Klasse ist eine Ausprägung eines kategorialen Zielmerkmals beim überwachten maschinellen Lernen.

Klassifikation Mit einem Entscheidungsbaum kann man Ausprägungen eines (mit einer gewissen Wahrscheinlichkeit) Merkmals vorhersagen. Anders formuliert kann man also ein Objekt einer Klasse zuordnen. Eine solche regelgeleitete Zuordnung zu einer Klasse nennt man Klassifikation.

Klassifikator Ein Klassifikator ist ein Regelsystem (z. B. Entscheidungsbaum), das bestimmte Objekte anahand von Prädiktormerkmalen klassifizieren kann.

Klassifizieren Das Klassifizieren eines Objekts entspricht dem Zuordnen eines Objekts zu einer Klasse (aus einer Menge möglicher Klassen). Klassen können auch als Merkmalsausprägungen eines kategorialen Merkmals verstanden werden.

Künstliche Intelligenz (KI) Künstlicher Intelligenz befasst sich mit der Frage, wie man Computer dazu bringen kann, Dinge zu tun, die Menschen bisher besser beherrschen. Dazu gehören verschiedenste Anwendungen, u. A. die Fähigkeit in verschiedenen Szenarios Vorhersagen zu treffen oder Klassifikationen vorzunehmen die mit einer hohen Rate korrekt sind. Somit zählen leistungsfähige Klassifikatoren (z.B. Entscheidungsbäume) zu den Anwendungen von Künstlicher Intelligenz.

Label Ein Label gibt die Klassenzugehörigkeit eines Objekts an. Das Label kann als Ausprägung eines Merkmals (Zielmerkmal) verstanden werden.

Maschinelles Lernen Maschinelles Lernen bezeichnet Verfahren, in denen eine Lernaufgabe automatisiert durch Lernalgorithmen basierend auf Daten gelöst wird. Maschinelles Lernen unterscheidet verschiedene Arten von Lernaufgaben. Typischerweise wird zwischen drei Arten von Lernaufgaben unterschieden: überwachtes Lernen, unüberwachte Lernen und bestärkendes Lernen. Beim überwachten Lernen geht es darum, die Ausprägung eines Zielmerkmals für eine bestimmte Art von Objekten vorherzusagen. Beim unüberwachten Lernen geht es darum, Objekte anhand bestimmter Merkmale in Gruppen ähnlicher Objekte zusammenzufassen und beim bestärkenden Lernen geht es darum, sogenannte „Agenten“ (z.B. Roboter) zum Handeln zu bringen. Bei allen Lernaufgaben kommen unterschiedlichste Lernalgorithmen zum Einsatz.

Merkmal Merkmale charakterisieren Objekte und können verschiedene Ausprägungen annehmen. Es gibt numerische und kategoriale Merkmale.

Objekt  Objekte sind Merkmalsträger jeglicher Art. D. h. Objekte können durch Merkmale beschrieben werden (Z. B. Lebensmittel werden durch Nährwerte beschrieben, Menschen durch charakterisierende Eigenschaften wie Haarfarbe oder Körpergröße). Dabei ist nicht festgelegt welche Merkmale zum beschreiben eines Objektes herangezogen werden.

Pfad Ein Pfad innerhalb eines Entscheidungsbaums ist eine Abfolge von Ästen, die im Wurzelknoten beginnt und in einem Blattknoten endet.

Prädiktormerkmal Beim überwachten maschinellen Lernen geht es darum für eine bestimmte Art von Objekten die Ausprägung eines Zielmerkmals vorherzusagen. Für die Vorhersage wird ein Regelsystem basierend auf weiteren Merkmalen erstellt. Diese weiteren Merkmale, auf denen also die Vorhersage beruht nennt man Prädiktormerkmale.  

Regelknoten Ein Entscheidungsbaum besteht aus verschiedenen Knoten. Zu Beginn stehen immer Regelknoten, die anhand von Prädiktormerkmalen gebildete Entscheidungsregeln repräsentieren. Alle Knoten in einem Entscheidungsbaum, bis auf die jeweils letzten Knoten weines Pfades, sind Regelknoten.

Schwellenwert Ein Schwellenwert ist eine Ausprägung, die zu einem numerischen Merkmal gewählt werden kann, um Objekte in Teildatensätze zu gruppieren. Die Teildatensätze ergeben sich aus den Objekten, deren jeweilige Ausprägung kleiner oder gleich dem Schwellenwert ist und denjenigen, deren jeweilige Ausprägung größer als der Schwellenwert ist.

Trainingsdaten Trainingsdaten sind ein Satz von Daten, die genutzt werden, um mit Hilfe von maschinellem Lernen einen Klassifikator (z. B. Entscheidungsbaum) zu erstellen.

Testdaten Testdaten sind ein weiterer Satz von Daten, mit denen ein erstellter KLassifikator getestet wird. Trainings- und Testdaten sind disjunkt.

Zielmerkmal Beim überwachten maschinellen Lernen geht es darum für eine bestimmte Art von Objekten die Ausprägung eines Merkmals vorherzusagen. Das betreffende Merkmal nennt man Zielmerkmal.  

Überwachtes maschinelles Lernen (engl.: supervised learning) Überwachtes maschinelles Lernen wird angewandt, um Entscheidungsmodelle zu erstellen, die für eine bestimmte Art von Objekten vorhersagen über ein Zielmerkmal treffen zu können. (z.B. Klassifizieren von Lebensmitteln als “eher empfehlenswert” und “eher nicht empfehlenswert”). Damit das überwachte Lernen angewandt werden kann, benötigt man zuerst digitale Repräsentationen von Objekten, worin die Objekte anhand bestimmer (Prädiktor-)Merkmale beschrieben sind (z. B. Lebensmittel, die durch Nährwertangaben repräsentiert sind). Zusätzlich müssen für alle Objekte die gewünschten Ausprägungen des Zielmerkmals (z.B. eher empfehlenswert/eher nicht empfehlenswert) bekannt sein. Eine Sammlung von Beispielobjekten, denen Werte von Prädiktormerkmalen und Labeln zugeordnet werden, werden so zu einem Satz von Daten, der modellhaft eine ganze Klasse an Objekten repräsentiert. Mit diesen Daten können mit Hilfe von Lernalgorithmen verschiedene Arten von Regelsystemen/Entscheidungsmodellen (z.B. Entscheidungsbaum, neuronales Netz) erstellt werden. Den Erstellungprozess nennt man auch “Lernprozess” oder “Trainingsprozess” und die Daten, die dafür genutzt werden, nennt man Trainingsdaten. Das Verarbeiten der Daten in diesem gesamten Trainingsprozess kann man als “überwachtes maschinelles Lernen” bezeichnen und dabei wird das Regelsystem immer besser an die vorliegenden Daten angepasst, bis am Ende möglichst wenig Fehler bei der Zuordnung (Fehlklassifikationen) passieren. Im ersten Schritt wird ein Entscheidungsmodell also so trainiert, dass es die Trainingsdaten korrekt zuordnet. Zielstellung ist es aber eigentlich, dass das Entscheidungsmodell über die Trainingsdaten hinaus funktioniert und auch neue Objekte (z.B. neue Lebensmittel) korrekt zuordnet. Im Anschluss wird das Entscheidungsmodell mit neuen Objekten bzw. Daten getestet und evaluiert. Dann spricht man von Testdaten. Der Begriff „überwacht“  wird in diesem Zusammenhang genutzt, da für alle verwendeten Objekte in den Daten die Ausprägung des Zielmerkmals bekannt ist und daher genau überwacht werden kann, wie gut des erstellte Entscheidungsmodell für die Daten funktioniert. Ein solches gut funktionierendes Entscheidungsmodell kann man als KI bezeichnen.

Lebensmitteldaten als Datenkarten 

In der Unterrichtsreihe werden 55 Datenkarten genutzt, die jeweils die typischen sieben Nährwertangaben eines Lebensmittels enthalten, wie z. B. in Abb. 1 für einen Apfel dargestellt. Die Darstellung der Lebensmitteldaten auf Datenkarten wie in Abb. 1 und das Arbeiten mit Daten knüpfen beispielsweise an das Thema Stochastik im Lehrplan NRW für die Erprobungsstufe (Klasse 5 und 6) an. Allerdings werden von Anfang an „multivariate“ Daten, Daten mit mehreren Merkmalen betrachtet, was in fachdidaktischen Vorschlägen schon länger als Bestandteil von Statistical Literacy gefordert wird. Ähnliche Bezüge finden sich auch in anderen Lehrplänen.

Mit den Datenkarten zu Lebensmittelobjekten wird im Unterricht folgende Leitfrage verfolgt:

  • Wie kann man mit Hilfe der Datenkarten ein Empfehlungssystem konstruieren, das ein Lebensmittel basierend auf seinen Nährwertangaben möglichst fehlerfrei als eher empfehlenswert oder eher nicht empfehlenswert klassifiziert?
Abb. 1: Datenkarte für das Lebensmittel „Apfel“

Ein solches Empfehlungssystem bezeichnet man als Klassifikator, da einzelne Objekte (hier Lebensmittel) basierend auf ihren Merkmalen (Nährwertangaben) einer Klasse („eher empfehlenswert“ oder „eher nicht empfehlenswert“) zugeordnet werden, d. h. sie werden klassifiziert. Man bezeichnet das binäre Merkmal ‚Empfehlung‘ als Zielmerkmal und die numerischen Nährwertmerkmale als Prädiktormerkmale.

Ein solcher Klassifikator wird auf der Basis einer Menge von Objekten entwickelt, für die sowohl die Ausprägungen der Prädiktormerkmale als auch des Zielmerkmals bekannt sind. Das sind die sogenannten Trainingsdaten. Ziel ist es aber immer, dass die Empfehlung auch für neue Objekte funktioniert. Zunächst wird das System mit Testdaten getestet, die nicht am Trainingsprozess beteiligt waren, für die aber die Ausprägungen des Zielmerkmals bekannt sind. Man kann damit abschätzen, mit welcher Wahrscheinlichkeit das System neue Objekte mit unbekannter Ausprägung korrekt klassifiziert.

Das Datenbeispiel umfasst 40 blaue Karten zum Erstellen des Empfehlungssystems und 15 gelbe Karten zum Testen. Es werden rote und grüne Büroklammern genutzt, mit denen im Unterricht die konsentierte Ausprägung des Zielmerkmals (auch Label genannt) dargestellt wird. Zum Herstellen eines einheitlich gelabelten Trainingsdatensatzes kann im Unterricht die Ernährungspyramide der Deutschen Gesellschaft für Ernährung (DGE, https://www.dge.de/gesunde-ernaehrung/dge-ernaehrungsempfehlungen/dreidimensionale-dge-lebensmittelpyramide/) genutzt werden.

Ein Entscheidungsbaum als Klassifikator

Im Folgenden wird für Lehrkräfte eingeführt, was ein Entscheidungsbaum ist und wie man einen solchen datenbasiert mit Datenkarten erstellen kann. Auf die unterrichtliche Umsetzung wird erst später eingegangen. Ein Entscheidungsbaum ist ein hierarchisches Regelsystem, das als Klassifikator genutzt werden kann. Ein Beispiel für einen Entscheidungsbaum zum zuvor beschrieben Kontext ist in Abb. 2 dargestellt. Man kann mit diesem Regelsystem z. B. den Apfel aus Abb. 1 klassifizieren, indem man den Entscheidungsbaum von oben nach unten durchläuft und abhängig von den Werten für die Merkmale Fett und Energie die passenden Abzweigungen wählt. Der erste Regelknoten fragt das Merkmal Fett ab. Da der Apfel weniger als 8 g Fett pro 100 g enthält, nimmt man den linken Ast und landet direkt in einem Endknoten (auch Blattknoten) des Entscheidungsbaums. Ein Endknoten enthält als Aufschrift immer eine Ausprägung des Zielmerkmals, die dem zu klassifizierenden Objekt zugeordnet wird. Der Apfel wird dementsprechend als „eher empfehlenswert“ klassifiziert. Bei einem Lebensmittel mit einem Fettwert größer als 8 g müsste man den rechten Ast nehmen und in zweiter Stufe noch den Energiewert betrachten, um in einen Endknoten zu gelangen.

Abb. 2: Ein Entscheidungsbaum

Dieser Entscheidungsbaum ist hier lediglich ein Beispiel ohne den Anspruch, Lebensmittel tatsächlich sinnvoll zu klassifizieren. Prinzipiell kann ein solcher Entscheidungsbaum beliebig viele Stufen und Prädiktormerkmale enthalten. Ziel der Unterrichtsreihe ist, dass Lernende solch einen Entscheidungsbaum datenbasiert selbst erstellen und verstehen, wie Computer so eingerichtet werden können, dass aus den Daten automatisiert Entscheidungsbäume erstellt werden (Maschinelles Lernen als Teil der KI).  

Einen Entscheidungsbaum datenbasiert erstellen

Eine Voraussetzung für das datenbasierte Erstellen von Entscheidungsbäumen ist, dass ein Datensatz vorliegt, der aus einer Menge von Beispielobjekten besteht, für die die Ausprägungen des Zielmerkmals und der Prädiktormerkmale bekannt sind. Wir betrachten im Folgenden (Abb. 3 und Abb. 4) beispielhaft elf Lebensmittel als Beispielobjekte, deren Nährwertangaben jeweils auf der Karte angegeben sind. Das sind die Ausprägungen der Prädiktormerkmale Fett, Energie etc. Ferner wird durch eine grüne (bzw. rote) Klammer (als Ausprägung des Zielmerkmals) symbolisiert, ob das Lebensmittel als eher empfehlenswert (bzw. eher nicht empfehlenswert) eingestuft ist. Mit so einer Datengrundlage kann ein Entscheidungsbaum nach und nach aufgebaut werden mit dem Ziel, die Trainingsdaten möglichst fehlerarm zu klassifizieren.

Abb. 3: Entscheidungsregel per Datensplit erzeugen

Als Basis für den Erstellungsprozess des Entscheidungsbaums dient der sogenannten Datensplit, d. h. durch ein Prädiktormerkmal und einen Schwellenwert werden zwei Teildatensätze erzeugt (Komponente 1). In Abb. 3 sieht man einen Datensplit mit dem Merkmal Fett und dem Schwellenwert 8 g, d. h. auf der rechten Seite befinden sich alle Lebensmittel mit mehr als 8 g Fett und links mit bis zu 8 g Fett. In beiden Teildatensätzen wird dann eine Mehrheitsentscheidung hinsichtlich des Zielmerkmals gefällt (Komponente 2). Auf der linken Seite in unserem Beispiel sind ausschließlich eher empfehlenswerte Lebensmittel und auf der rechten Seite ist die Mehrheit der Lebensmittel eher nicht empfehlenswert. Die resultierende Entscheidungsregel (wenn ≤ 8 g Fett, dann eher empfehlenswert; wenn > 8 g Fett, dann eher nicht empfehlenswert) kann evaluiert werden (Komponente 3), indem die Anzahl der dadurch im Datensatz falsch klassifizierten Lebensmittel (Fehlklassifikationen) bestimmt wird. In unserem Beispiel sind es zwei Lebensmittel, die falsch klassifiziert werden, nämlich Avocado und Spiegelei auf der rechten Seite. Die Datensplits werden beim Aufbau eines Entscheidungsbaumes so gewählt, dass diese Mehrheitsentscheidungen möglichst wenige Fehlklassifikationen erzeugen. Abschließend kann man den resultierenden einstufigen Entscheidungsbaum repräsentieren (Komponente 4). Dies kann rein verbal geschehen oder durch ein typisches Baumdiagramm. In der Repräsentation des Entscheidungsbaums kommen die Datenkarten nicht mehr vor, aber es sollte statt der Karten (vgl. Abb. 3) die Verteilung des Zielmerkmals in beiden Teildatensätzen (4 zu 0; 2 zu 5) notiert werden, damit die Anzahl der Fehklassifikationen nachvollziehbar ist.

Nun kann man den bisher einstufigen Entscheidungsbaum, der ja zwei Lebensmittel falsch klassifiziert, weiter verbessern, indem man eine weitere Stufe hinzufügt. Die Datenkarten im linken Ast können beiseitegelegt werden, da dort schon alles korrekt klassifiziert wird. Mit den Karten im rechten Ast verfährt man genau wie für die erste Stufe beschrieben. Wenn man das Prädiktormerkmal Energie und den Schwellenwert 220 kcal für einen weiteren Datensplit nutzt, erhält man den Entscheidungsbaum aus Abb. 2, der für dieses Datenbeispiel alle Lebensmittel korrekt klassifiziert.

Abb. 4: Sortierte Datenkarten zum Vergleich von Datensplits. Zur besseren Lesbarkeit sind die Fettwerte oberhalb der Karten notiert.

Ein zentraler Aspekt, der bisher noch nicht erklärt wurde, ist wie ein Merkmal und ein Schwellenwert für einen ersten Datensplit und dann für die weiteren „günstig“, also derart, dass möglichst wenig Fehlklassifikationen auftreten, ausgewählt werden. Mit den Datenkarten kann dies durch Sortieren und systematisches Probieren umgesetzt werden.

Ausgehend von den sortierten Datenkarten können verschiedene mögliche Datensplits und die resultierende Anzahl von Fehlklassifikationen miteinander verglichen werden. Für ein gegebenes Datenbeispiel betrachten wir denjenigen Datensplit als optimal, der die geringste Anzahl falsch klassifizierter Objekte liefert. In diesem Beispiel ist der optimale Datensplit der in Abb. 4 visualisierte zwischen der Graubrot-Scheibe und den Chicken Nuggets. Dies kann man überprüfen, indem man systematisch alle Datensplits untersucht. Dafür verschiebt man den trennenden senkrechten Strich einmal in alle Zwischenräume zwischen zwei Karten und wendet jeweils die zuvor erläuterten Komponenten 1-3 an, um die Anzahl falsch klassifizierter Objekte zu ermitteln. Ein Datensplit zwischen Avocado und Pommes liefert z. B. drei falsch klassifizierte Objekte und ist somit schlechter zu bewerten.

Wenn ein optimaler Datensplit ausgewählt ist (in unserem Beispiel mit zwei falsch klassifizierten Objekten), kann ein Schwellenwert im Intervall zwischen den Fettwerten der beiden anliegenden Karten gewählt werden. In Abb. 4 wurde im Intervall zwischen den Werten 4,9 und 11,0 der Wert 8 als Schwellenwert gewählt. Für alle anderen Prädiktormerkmale kann dann auch ein optimaler Datensplit bestimmt werden, um anschließend das Prädiktormerkmal auszuwählen, das eine möglichst geringe Anzahl falsch klassifizierter Lebensmittel liefert. Man geht also mit einer sogenannten „Greedy-Strategie“ vor, d. h. man sucht den besten einstufigen Entscheidungsbaum und betrachtet dann erst die zweiten Stufen und entscheidet, ob dort weitere Datensplits nötig sind. Dort wählt man wieder das beste Merkmal mit dem optimalen Datensplit in der betrachteten Teilmenge der Daten. Es ist diese systematische Methode, die im Wesentlichen in den professionellen Entscheidungsbaum-algorithmen implementiert ist. Dazu gehören dann noch geeignete Abbruchkriterien. In der Unterrichtspraxis ist das Einbeziehen aller Datensplits für Lernende sehr mühsam, sodass (zunächst) etwas vereinfachte Strategien, die bei der Beschreibung des Unterrichts im nächsten Abschnitt erläutert werden, verwendet werden können. Diese Strategien folgen dem gleichen Ansatz und können deshalb die Grundlage dafür liefern, zu verstehen, wie eine Maschine automatisiert, vollständig und systematisch vorgeht.

Materials

Download of all materials

Hier können Sie alle Arbeitsblätter, Hilfszettel und Hinweisblätter als komprimierten Ordner herunterladen:

Eine Druckvorlage für die Datenkarten finden Sie hier:

Zwei Klassensätze der Datenkarten können Sie hier bestellen:

Further information

Learning path for pupils - decision trees with data cards

The learning path “Decide like an AI” was created in cooperation between ProDaBi and inf-schule.de. It offers a supplement to the food data cards developed in ProDaBi and the corresponding series of lessons on decision trees.
The learning path is prepared for pupils and has the following introductory text: “In this learning path, you are to create an artificial intelligence (AI) that decides whether a food is recommended or not recommended based on its nutritional values. You will train your AI yourself with selected foods in order to have a decision-making aid for other foods afterwards.”

Links:

Informationen über Maschinelles Lernen

Maschinelles Lernen ist ein weiter Bereich, der verschiedene Methoden und Lernalgorithmen für das automatische Lösen unterschiedlichsterer Aufgabentypen umfasst. Das verbindende Element zwischen allen Methoden die zum maschinelle Lernen gehören ist, dass sie auf Trainingsdaten beruhen. Wir konzentrieren uns auf die Unterart des überwachten Lernens, insbesondere auf Klassifikationsaufgaben, die mit Entscheidungsbäumen gelöst werden können.
Bei der Klassifikation geht es darum, Objekte oder Individuen einer Population mit (idealerweise) korrekten Labels in Bezug auf eine bestimmte Fragestellung zu versehen. In der Statistik ist eine Population eine Menge von ähnlichen Individuen, Objekten oder Ereignissen, die für eine bestimmte Frage oder statistische Untersuchung von Interesse sind. Typische Beispiele für Klassifikationsaufgaben sind die Zuordnung eines Patienten (Individuum) zu einer Diagnose (Etikett) oder die KLassifikation von E-Mails als “Spam” oder “kein Spam”. Die möglichen Labels stammen aus einer Label-Menge, je nachdem, ob man von einem binären Klassifikationsproblem (zwei mögliche Labels) oder einem Multiklassen-Klassifikationsproblem (eine endliche Menge von mehr als zwei Labels) spricht.

Die Aufgabe eines Lernalgorithmus besteht darin, einen Klassifikator zu erstellen, der für jedes beliebige Objekt in der Population ein Label vorhersagt. Um eine fundierte Vorhersage zu treffen, wird ein Objekt durch eine Reihe von Merkmalen repräsentiert, die als Vektor dargestellt werden. Da die Merkmale die Wahl des vorhergesagten Labels beeinflussen, werden sie als Prädiktorvariablen bezeichnet. Die Labels sind die Werte einer so genannten Zielvariable. Die Erstellung eines Klassifikators basiert auf Trainingsbeispielen, d. h. auf Objekten aus der Grundgesamtheit, von denen die Werte der Prädiktorvariablen und die korrekten Labels bekannt sind. Ein Satz von Trainingsbeispielen wird als Trainingsdaten bezeichnet. Als Maß für den Erfolg wird in der Praxis  anhand von Testdaten  die Fehlklassifikationsrate berechnet. Die Testdaten sind strukturell identisch mit den Trainingsdaten, wurden aber nicht zur Erstellung des Klassifikators verwendet.

Entscheidungsbäume werden algorithmisch aus Daten konstruiert, um als Klassifikatoren zu dienen. Besonders wenn der Baum nicht zu groß ist, macht die Verwendung einer hierarchischen Baumstruktur die Entscheidung sehr transparent und verständlich.

Informationen zum Nutri-Score

Ein Infoblatt zum Nutri-Score und der einfacheren Kategorisierung in der ProDaBi Unterrichtsreihe finden Sie hier:

Kurzübersicht über die Inhalte der Unterrichtsstunden

Citation:

Fleischer, Y., Podworny, S., Biehler, R., Schulte, C., Höper, L. & Hüsing, S. (2023). Entscheidungsbäume mit Datenkarten - Apfel oder Popcorn? Eine enaktive Einführung in KI, maschinelles Lernen und Entscheidungsbäume mit Datenkarten. https://www.prodabi.de/materialien/entscheidungsbaeume/

Veröffentlicht am 07.04.2025

Version:

License note:

Creative Commons Attribution-ShareAlike (CC BY-SA 4.0)

Nach oben scrollen