Document Clustering


Beschreibung

Damit eine große Anzahl Schnipsel (ca. 600 Mio. beim Stasi Projekt) korrekt gepuzzelt werden kann, müssen diese entsprechend ihren Eigenschaften zuerst sortiert bzw. geclustert werden. Dies bedeutet, dass mit einer höheren Wahrscheinlichkeit angenommen werden kann, dass z.B. Schnipsel mit Handschrift zusammengehören.

Document Clustering

Zielsetzung

Ziel des Praktikums ist es unterschiedliche Cluster Algorithmen in dem, schon vorhandenen, Feature Raum zu vergleichen.