Beschreibung
Damit eine große Anzahl Schnipsel (ca. 600 Mio. beim Stasi Projekt) korrekt gepuzzelt werden kann, müssen diese entsprechend ihren Eigenschaften zuerst sortiert bzw. geclustert werden. Dies bedeutet, dass mit einer höheren Wahrscheinlichkeit angenommen werden kann, dass z.B. Schnipsel mit Handschrift zusammengehören.
Zielsetzung
Ziel des Praktikums ist es unterschiedliche Cluster Algorithmen in dem, schon vorhandenen, Feature Raum zu vergleichen.