Beschreibung
Für verschiedene Analysen (OCR, Layoutanalyse) ist es notwendig einzelne gescannte Seiten oder Schnipsel zuerst auszurichten. Da andere Methoden auf der Skew Detection aufbauen, ist es wichtig eine möglichst robuste Schätzung zu finden. Die meisten in der Literatur vorhandenen Methoden behandeln nur die Ausrichtung ganzer Seiten bzw. sind restriktiv betreffend dem Inhalt oder der maximalen Rotation der Dokumente. Unterschiedliche Ansätze (Hough, Projection Profile, Blob Analyse …) sollen gegenüber gestellt und deren Vor- bzw. Nachteile diskutiert werden.
Zielsetzung
Ziel dieses Praktikums ist die Einarbeitung in die Literatur vorhandener Methoden und die Implementierung und der Vergleich einzelner Methoden (siehe Literatur). Die Auswertung soll einerseits auf ganzen Seiten als auch auf einzelnen Schnipseln erfolgen. Zusätzlich können die implementierten Methoden mit der aktuell im Projekt verwendeten Methode verglichen werden.
Literatur
Yue Lu, Chew Lim Tan, Improved Nearest Neighbor Based Approach to Accurate Document Skew Estimation, ICDAR 2003.
Xiaoyi Jiang, Horst Bunke, Dubravka Widmer-Kljajo, Skew Detection of Document Images by Focused Nearest-Neighbor Clustering.
P. Shivakumara et al., New Moments based Skew Estimation Technique using Pixels in the Word for Binary Document Images, ICDAR 2005.
Jonathan Hull, Document Image Skew Detection: Survey and Annotated Bibliography, Document Analysis Systems II, 1998.
G.S. Peake and T.N. Tan, A General Algorithm for Document Skew Angle Estimation, 1997.
A. Amin and S. Fischer, A Document Skew Detection Method Using the Hough Transform, Pattern Analysis and Applications, Vol.3, pp. 243–253, 2000.