Beschreibung
Segmentierung beschäftigt sich mit der Identifikation zusammenhängender Regionen (z.B. Buchstaben) entsprechend einem Homogenitätskriterium (z.B. Grauwert). Dies ist in der Dokumentanalyse ein vorverarbeitender Schritt, z.B. für Optical Character Recognition (OCR). Da es sich um einen Vorverbeitungsschritt handelt, ist die Genauigkeit der Segmentierung ausschlaggebend für den Erfolg nachfolgender Methoden. Die Herausforderung besteht in der korrekten Segmentierung von Schnipseln, die sich in einem schlechten Zustand befinden (kontrastschwach, Kaffeeflecken, ausgebleicht)
Zielsetzung
Ziel dieses Praktikums ist die Implementation sowohl globaler als auch lokaler Binarisierungsalgorithmen und die Auswertung auf zuvor manuell erstellter Ground Truth (GT) Daten. Hierzu soll zuerst eine Literaturrecherche durchgeführt werden und danach die Ergebnisse einzelner Algorithmen miteinander verglichen werden.
Literatur
Nobuyuki Otsu, A threshold selection method from grey level histograms. In: IEEE Transactions on Systems, Man, and Cybernetics. New York 9.1979, S.62–66.
J. Sauvola, M. Pietikäinen, Adaptive Document image binarization, Journal of Pattern Recognition, 33(2000), 225-236.
Gatos, B. and Pratikakis, I. and Perantonis, S. J., Adaptive degraded document image binarization, Pattern Recognition, Vol. 39, No 3, pp. 317—327, 2006.
Bolan Su, Shijian Lu, Chew Lim Tan, Binarization of Historical Document Images Using the Local Maximum and Minimum, DAS 2008. (Implementierung vorhanden)
Utpal Garain, Thierry Paquet, Laurent Heutte, On foreground – background separation in low quality document images, Journal of Document Analysis, 8(1): 47-63, 2006.