×
produktlogotitle

 DOWNLOADSEITE

Seite: db_index
Diese Seite wurde aktualisiert am 08.08.2025

LOGIN
Benutzer:
Passwort:
 
Geogebra-
   ifwp.net-schulbuch.de
Startseite Künstliche Intelligenz Überwachtes Lernen Diese Seite wurde aktualisiert am 08.08.2025

KI: Überwachtes Lernen

In diesem Kapitel wollen wir die Idee des überwachten Lernens vertiefen.

Das Lernen erfolgt dabei in mehreren Schritten, die hier kurz an einem Beispiel dargestellt werden. 

 

Das Beispiel

Es gibt zwei Sorten von Insekten, Marienkäfer und Raupen. Das System soll lernen, wie man sie anhand von Messdaten erkennen kann. Dazu wurden Breite und Länge von vielen Insekten gemessen und dabei festgehalten, um welche Sorte Insekt es sich jeweils handelt.

 

1. Die Daten

Es handelt sich hier um markierte Datensätze. Für jeden Datensatz werden die Werte von Attributen sowie die Markierung angegeben.

  • Die Attribute nennt man auch . Anhand dieser Werte soll das System später erkennen, um welches Sorte Insekt es sich handelt.
  • Die Markierung ist die sogenannte Zielvariable

 

Es gibt dort Längen- und Breitenangaben von Marienkäfern und Raupen und wir suchen nach Regeln, um Käfer von den Raupen unterscheiden zu können.

  

2. Graphische Darstellung der Daten

Die Daten, die als Tabelle vorhanden sind, können in Form eines sogenannten  dargestellt werden:

 

Icon Partner 30x26 Aufgabe

Schau dir mit deinem Nachbarn / deiner Nachbarin das obige Streudiagramm an.

  1. Beschreibe, wie man ein Insekt in das Diagramm aufnimmt.

  2. Gib an, welche Maße dasjenige Insekt in der unteren linken Ecke des Diagramms hat.

  3. Gib an, welche Maße die beiden Insekten am rechten Rand des Diagramms haben.

  4. Unten siehst du eine Tabelle mit 5 weiteren Einträgen (bekannte Insekten).
    Erstelle jetzt (auf Papier) ein Streudiagramm, in dem diese Daten eingetragen sind.

  5. Daneben findest du eine Tabelle, in der Daten von 4 weiteren Insekten eingetragen sind (unbekannte Insekten). Leider wissen wir nicht, ob es sich um Raupen oder Marienkäfer handelt.
    Trage auch diese Daten in dein Streudiagramm ein. Hast du ggf. eine Vermutung, um welche Art von Insekt es sich jeweils handelt? Begründe deine Vermutung.

  6. Gib deinem Nachbarn / deiner Nachbarin die Daten (Länge und Breite) von zwei weiteren Insekten. Er bzw. sie soll diese Daten dann in das Streudiagramm eintragen und eine Vermutung anstellen, ob es sich um eine Raupe oder einen Marienkäfer handelt. 
bekannte Insekten
unbekannte Insekten

 


3. Schwellenwerte

Die zentrale Idee sind die sogenannten :

 

In das obige Streudiagramm wurde eine zusätzliche Angabe eingetragen:

 

 

Man erkennt in dieser Grafik:

  • Alle Insekten, die länger als 58 mm sind, sind tatsächlich Raupen. In dem blau-unterlegten Bereich findet man ausschließlich blaue Marker.
  • Wenn man alle anderen Insekten als Marienkäfer bezeichnet, hat man 4 Tiere falsch klassifiziert. Unser bis hierher trainiertes Informatiksystem wird alle diese Insekten als Marienkäfer bezeichnen, doch die 4 Insekten (blaue Marker) sind tatsächlich Raupen.

Der Schwellenwert 58 erzeugt also 4 Fehler. Hätte man einem Informatiksystem diese Regel beigebracht, hätte es also in 4 Fällen falsch gelegen.

Jetzt sucht man einen Schwellenwert für das Attribut Länge, so dass möglichst wenig Fehlklassifikationen entstehen:

 

Wenn wir

  1. die Prädiktor-Variable Länge zur Klassifikation und
  2. einen Wert zwischen 50 und 55 (z.B. 52) als Schwellwert

benutzen, wird das System die wenigsten Fehler (nämlich 3) bei der Klassifikation machen.

 

Jedoch könnten wir auch das Attribut Breite zur Klassifikation nutzen und einen möglichst guten Schwellenwert suchen. Dabei findet man:

 

Ergebnis:

Wählt man als Prädiktor-Variable die Variable Breite, dann ist z.B. der Wert 28 als Schwellenwert optimal, da dann die Anzahl der Fehler minimal (nämlich 1) ist.

 

Damit kann man jetzt eine Klassifikation in einer Stufe vornehmen, bei der noch ein Insekt fehlerhaft klassifiziert wird. 

In einer zweiten Stufe kann man alle Insekten, die eine Breite von mehr als 28 haben, mit Hilfe der Länge klassifizieren. 

4. Entscheidungsbaum

Ein Algorithmus erzeugt dann mit Hilfe von Schwellenwerten aus diesen Daten einen sogenannten :

 

 

Damit haben wir das Informatiksystem so trainiert, dass alle Trainingsdaten korrekt klassifiziert werden, so dass wir folgende Regeln aufstellen können:

Entscheidungsregel:

  • Ist ein Insekt nicht breiter als 28 mm ist, so ist dieses Insekt mit Sicherheit eine Raupe.
  • Ist es breiter als 28 mm, jedoch nicht länger als 58 mm, dann ist es ein Marienkäfer.
  • Ist es breiter als 28 mm und länger als 58 mm, handelt es sich um eine Raupe.

 

  Aber Achtung: 

Das so trainierte Informatiksystem in diesem Beispiel wird mit den Trainingsdaten keine Fehler machen; alle 20 Insekten werden korrekt klassifiziert. Doch:

  1. Um ein Informatiksystem mit Hilfe eines Entscheidungsbaums zu trainieren, benötigt man viel mehr Trainingsdaten. In der Praxis sind dies mehrere Tausend oder noch viel mehr.
     
  2. Dass ein Entscheidungsbaum alle Trainingsdaten korrekt klassifiziert, ist eher ungewöhnlich. In der Regel werden nicht alle Datensätze - auch mit den optimalen Schwellenwerten - korrekt klassifiziert.

  3. Ob andere Insekten (also solche, die nicht in den 20 Trainingsdaten vorkamen) in diesem so trainierten System korrekt klassifiziert werden, ist noch völlig ungewiss. 

5. Neue Insekten klassifizieren

 

Der Entscheidungsbaum kann jetzt benutzt werden, um unbekannte Insekten zu klassifizieren. So ist das Insekt in der ersten Zeile wahrscheinlich eine Raupe, dasjenige aus der zweiten Zeile - das sagt jedenfalls der Baum - ein Marienkäfer. 

 

Aufgabe  

Welchen Vorschlag macht der Entscheidungsbaum für das Insekt, dessen Daten in der dritten Zeile stehen?

 


An einem anderen Beispiel werden wir den Lernalgorithmus, der einen Entscheidungsbaum erzeugt, systematisch entwickeln und später in einem Python-Programm umsetzen, das dann automatisch aus vorgegebenen Daten einen Entscheidungsbaum erzeugen kann.

Es geht dort um die Klassifikation von Lebensmitteln.

Impressum
© 2023  Net-Schulbuch.de

10.07  0.0873  8.1.33