De afkorting OCR staat voor Optical Character Recognition. Kortgezegd is OCR een techniek waarmee de computer letters, cijfers en leestekens van een plaatje kan ‘aflezen’. OCR-software wordt gebruikt om papieren documenten en boekwerken te transformeren tot digitale versies, zodat ze kunnen worden bewerkt en gearchiveerd. Formulieren, brieven, contracten, artikelen, rapporten en handleidingen kunnen zo in een handomdraai worden omgezet naar bewerkbare teksten – in een Wordbestand, bijvoorbeeld.
Er is echter een belangrijk onderscheid tussen simpele en slimme OCR-software. In deze blog lichten we dit toe en vertellen we je wat de voordelen zijn van geavanceerde OCR-software in het factuurverwerkingsproces!
Hoe werkt OCR?
OCR werkt op basis van patroonherkenning. De tekst die moet worden gelezen, wordt eerst gescand en herkend als afbeelding – bijvoorbeeld als een JPEG-bestand of pdf-document. Vervolgens destilleert OCR-software letters, cijfers en leestekens uit het plaatje op pixelniveau. Daaruit komen woorden en tekst. Scan je dus een papieren document, dan kan OCR-software dit binnen een mum van tijd vertalen naar een doorzoekbaar digitaal document.