An drei Beispielen wird die Problemstellung deutlich:
In einem Stadtteil sollen neue Mobilfunkmasten gebaut werden. Wo sollen diese Masten errichtet werden, damit die Bewohner des Stadtteils optimal versorgt werden? Die Situation ist - natürlich sehr vereinfacht - auf der Karte zu sehen. Auf der Karte sieht man die Lage von 15 Wohnungen (schwarze Punkte) sowie Prototypen, also die Lage von 3 möglichen Positionen der Masten (die farbigen Kreuze). Was bedeutet den optimal? Wo sollte man die Masten optimal positionieren? Und welchen Mast benutzen dann die jeweiligen Wohnungen? Und reichen drei Masten? Oder sind auch zwei Masten schon ausreichend?

In einer sehr vereinfachten Art wurden der Fettgehalt und der Anteil an Kohlenhydraten von Lebensmitteln analysiert, und die Daten in ein Koordinatensystem eingetragen. Man möchte jetzt die Lebensmittel klassifizieren, so dass ähnliche Lebensmittel in gleichen Klassen zu finden sind.
Auf der Karte sieht man die Werte der Lebensmittel (schwarze Punkte) sowie mögliche Repräsentanten (Prototypen) von 3 Gruppen (die drei farbigen Kreuze).
Im Laufe des Verfahrens werden die Positionen der drei Prototypen schrittweise verbessert.
Wo sollte man die Prototypen optimal positionieren? Und von welchem Prototyp wird dann ein Lebensmittel repräsentiert?

Im mittleren Westen der USA entdeckte man an verschiedenen Stellen größere Goldfunde. Jetzt wollte man drei Grabungsteams hinschicken, die dort das Gold schürfen sollten.
Auf der Karte sieht man die Positionen der Goldfunde (schwarze Punkte) sowie Prototypen, also mögliche Positionen für die Lager der Grabungsteams (die drei farbigen Kreuze).
Wo sollte man für die drei Teams das Lager aufschlagen? Und welches Grabungsteam wird zu einem bestimmten Fundort reisen?
In allen drei Beispielen geht es um die gleiche Problemstellung, die man abstrakt beschreiben kann:
Vorgegeben sind mehrere Datenpunkte, die in Form von Koordinaten beschrieben werden können. Diese Datenpunkte sollen in Gruppen klassifiziert werden. Dazu ermittelt man die Lage (also die Koordinaten) von sogenannten Prototypen. Jeder Prototyp wird dann eine Gruppe repräsentieren, so dass jeder Datenpunkt genau einem dieser Prototypen zugeordnet werden wird.

Wo sollte man die Prototypen optimal positionieren? Und welcher Prototyp ist dann für einen Datenpunkt charakteristisch?
An zwei Beispielen wird der sogenannte VQ-Algorithmus (VectorQuantifikation) vorgestellt, der - in Abhängigkeit von den Daten - die Prototypen möglichst gut so platziert, dass die Daten in Gruppen eingeteilt werden:
- Das Goldgräberproblem
- Das Lebensmittelproblem, jedoch statt mit nur zwei Attributen (Fett und Kohlenhydrate) dann mit 7 Attributen, so wie es in der Realität üblich ist.
Anschließend werden die Lebensmittel mit einem alternativen Algorithmus (k-means) in Gruppen eingeteilt.