Blogs

Technik schnell erklärt.

OCR-Erkennung: Was sie ist und wie sie funktioniert.

Belege mühsam händisch verbuchen, zählt im Büroalltag zu den weniger beliebten Aufgaben. Wenn sich dann auch dabei ein Tippfehler einschleicht, geht die langwierige Suche nach dem Irrtum los, was wiederum unnötig Zeit beansprucht. Doch mit der fortschreitenden Digitalisierung in Unternehmen, wurde auch für dieses Problem eine Lösung entwickelt: Sie hört auf den Namen OCR-Erkennung.

Sie ermöglicht beispielsweise gedruckte Belege oder andere Dokumente  binnen weniger Sekunden zu digitalisieren bzw. Datensätze zu erfassen, damit Sie diese bequem am Computer weiter bearbeiten können.


OC-was?

OCR kommt aus dem Englischen und steht für Optical-Character-Recognition, also auf gut Deutsch “Zeichenerkennung”. Die Technologie kommt aber nicht nur im Zuge der Belegerkennung zum Einsatz, sondern ist bei Passkontrollen oder auch als Lesehilfe bei Blinden und Sehschwachen vorzufinden. 

Doch wie funktioniert die OCR-Erkennung? Was steckt hinter dieser Technologie?

Lesen Sie weiter und werden Sie in wenigen Minuten zum Technik-Experten.

OCR-Erkennung
by TeroVesalainen on Pixabay


OCR-Erkennung schnell erklärt.

OCR ist eine revolutionäre Technologie, die wie oben beschrieben hinter vielen Lösungen steckt. Besonders hilfreich im Büroalltag ist die automatische Datenerfassung.  Denn indem der Computer diese Arbeit übernimmt, sparen Sie sich nicht nur viel Zeit, sondern reduzieren die Fehlerquote erheblich. Clevexa, unser digitales Spesenmanagement-Tool, zum Beispiel nutzt diese Technologie zur Belegerfassung, wodurch Ihr Smartphone im handumdrehen zum OCR-Scanner wird. 

Was wir Menschen in mühevoller Tipparbeit abarbeiten, erledigt der Computer folgendermaßen in wenigen Sekunden: 


Schritt 1: Layoutanalyse.

Was macht OCR: Sobald Sie beispielsweise die Rechnung Ihres erfolgreichen Geschäftsessens eingescannt bzw. fotografiert haben, analysiert das Tool zunächst dessen Seitenaufbau. Dabei trennt es das Bild vom Text, zählt die Absätze und erkennt ggf. die Seitenanzahl. Dabei merkt sich die OCR-Erkennung die genaue Position der jeweiligen Textelemente.


Schritt 2: Differenzierung der Textblöcke.

Hier greift nun der komplexeste Prozess ein:In weiterer Folge nimmt die Software die Textblöcke genauer unter die Lupe und zerlegt ihre Struktur zunächst in Satzbausteine, anschließend in einzelne Wörter und schließlich Buchstaben.


Schritt 3: Vom Pixel zum Wort.

Die OCR-Erkennung hat bereits Muster von Zeichen abgespeichert, welche  nach Schritt 2 mit jenen Buchstaben Ihres Dokuments abgeglichen werden. Bei einer Ähnlichkeit von 99% legt der Algorithmus fest, dass der Pixelhaufen im Dokument ein bestimmter Buchstabe sein muss. Folglich werden die Buchstaben zu Wörtern zusammengesetzt und diese dann an der richtigen Stelle im Satz eingeordnet.

Der digitalisierte Text wird in einem neuen Dokument abgespeichert und ist zum Bearbeiten bereit.

#CorpLifeTipp: Wer sich für die technische Entwickelt von den Anfängen bis heute interessiert, sollte unbedingt den Beitag auf webpdf.de lesen.  


Das war jetzt alles ein bisschen viel?

Im folgenden Video bekommen Sie alles zum heutigen Thema nochmals erklärt (bis 4:32)


Teilen Sie diesen Beitrag:

Datum:

16. Juli 2019

Autor:

CorpLife

0 Kommentare

Ihre E-Mail Adresse wird nicht veröffentlicht.

Gleich kommentieren.

avatar
  Subscribe  
Notify of
SPRACHE
1
SOZIAL