Text Detection and Script Classification

Beschreibung

Bei der Layoutanalyse werden die Regionen einer Seite/eines Schnipsels identifiziert. Dies dient einerseits dazu Textbereiche von anderen Bereichen (z.B. Bildern) zu unterscheiden als auch unterschiedliche Layouts einzelner Seiten zu klassifizieren. Aufgrund der Detektion von Textbereichen kann danach ebenfalls die Schriftklassifikation durchgeführt werden. Dies beinhaltet die Unterscheidung von Hand- bzw. Maschinschrift.

Script Classification

Zielsetzung

Ziel dieses Praktikums ist die Literaturrecherche im Bereich Layoutanalyse und Schriftklassifikation. Des weiteren soll eine Methode ausgewählt und implementiert werden. Die Ergebnisse der Schriftklassifikation können mit einem im Projekt vorhandenen Algorithmus verglichen werden.

Literatur

Farshad Nourbakhsh, Peeta Basa Pati A. G. Ramakrishnan, Document Page Layout Analysis Using Harris Corner Points, 2006.
Ergina Kavallieratou, Stathis Stamatatos, Discrimination of Machine-Printed from Handwritten Text Using Simple Structural Characteristics, ICPR 2004.
Zhixin Shi and Venu Govindaraju, Multi-scale Techniques for Document Page Segmentation, ICDAR 2005.
Krishna Subramanian et al., Character-Stroke Detection for Text-Localization and Extraction, ICDAR 2007.
Yefeng Zheng et al., Machine Printed Text and Handwriting Identification in Noisy Document Images, IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 26, NO. 3, 2004.