magistrsko delo Organizacija in management informacijskih sistemov
Tina Nemanič (Avtor), Robert Leskovar (Mentor)

Povzetek

Magistrska naloga obravnava odprtokodno knjižnico Tesseract za optično prepoznavo znakov (OCR, optical character recognition) na operacijskem sistemu Android. Podane so osnove in pregled aktualnih raziskav na področju optične prepoznave znakov. Raziskave so usmerjene v: a) prepoznavanje ročne pisave, b) samostojne aplikacije na mobilnih napravah, c) delovanje v realnem času v kombinaciji s prevodom, d) večjezične aplikacije in e) strojno učenje. Razlogi za odločitev za uporabo knjižnice Tesseract so: odprta koda, najboljši rezultati pri neodvisnih merjenjih in prilagojenost za operacijski sistem Android. Kot razvojno orodje je bil uporabljen Android Studio zaradi enostavnosti uporabe, ugodne krivulje učenja, možnosti uporabe čarovnika in močnih orodjih za razhroščevanje. Razvita rešitev je aplikacija za operacijski sistem Android 5.0 Lollipop, ki uporablja API 21. V letu 2016 bi razvito aplikacijo lahko uporabilo približno 40,5% naprav. Aplikacija deluje popolnoma avtonomno, čas prepoznave je pod eno minuto. Rezultati testiranja so pokazali, da v slabih svetlobnih pogojih, kot je na primer slika plinskega ali električnega števca, dobimo zelo nizko stopnjo prepoznanih številk. To stopnjo je možno povečati z dodatnim treningom aplikacije, vendar so tudi tu pomembne omejitve.

Ključne besede

odprta koda;OCR - optična prepoznava znakov;Android;

Podatki

Jezik: Slovenski jezik
Leto izida:
Tipologija: 2.09 - Magistrsko delo
Organizacija: UM FOV - Fakulteta za organizacijske vede
Založnik: [T. Nemanič]
UDK: 004
COBISS: 7939603 Povezava se bo odprla v novem oknu
Št. ogledov: 904
Št. prenosov: 141
Ocena: 0 (0 glasov)
Metapodatki: JSON JSON-RDF JSON-LD TURTLE N-TRIPLES XML RDFA MICRODATA DC-XML DC-RDF RDF

Ostali podatki

Sekundarni jezik: Angleški jezik
Sekundarni naslov: Application of open-source library for optical character recognition on operating system Android
Sekundarni povzetek: Master's thesis addresses open-source library Tesseract for optical character recognition (OCR) on Android operating system. Foundations and survey of contemporary research on the field of optical character recognition are presented. Research is focused in: a) recognition of handwriting, b) autonomous applications on mobile devices c) real-time recognition in combination with translation in other languages, d) multilingual applications and e) machine learning. Rationales to choose Tesseract OCR library are open source code, the best results in independent measurement and suitability for Android operating system. Android Studio was used as a development tool due to simplicity of use, steep learning curve and powerful debugging tools. Application is developed for Android 5.0 Lollipop operating system, which uses API level 21. Approximately 40.5 % of devices in year 2016 could use developed application. Application works autonomously, time of optical recognition is under one minute. Results of a tests shows that the rate of character recognition on gas or electricity meter in poor light conditions is very low. It is possible to increase this rate with additional training of application, however with significant limitations.
Sekundarne ključne besede: open source code;OCR – optical character recognition;Android;application;Tesseract library;
URN: URN:SI:UM:
Vrsta dela (COBISS): Magistrsko delo/naloga
Komentar na gradivo: Univ. v Mariboru, Fak. za organizacijske vede
Strani: 33 f.
ID: 10840345