Spring naar content

Hoe werkt OCR? En wat is de toekomst van OCR-software?

Je hoort veel over het automatisch herkennen van documenten, maar hoe werkt OCR nu eigenlijk precies? De afkorting ‘OCR’ staat voor Optical Character Recognition. De term vertegenwoordigt een techniek waarmee de computer letters, cijfers en leestekens van een plaatje afleest. Handig, want zo transformeer je documenten tot digitale versies om ze te kunnen bewerken en archiveren. Klinkt goed. Maar hoe werkt OCR in jóuw voordeel? En wat is de volgende stap op OCR-gebied?

Vroeger en nu: hoe werkt OCR in de basis en waar ligt de meerwaarde?

Tijdens het OCR-proces zet de software de ‘leesbare’ gegevens op een plaatje om in digitale data. Het resultaat is een bewerkbare tekst. Vroeger was dit meer dan voldoende. OCR was toen behoorlijk complex, omdat documenten veelal per post werden verstuurd. Een driedubbel gevouwen document met koffievlekken uitlezen was een sterk staaltje technisch vernuft. En OCR-software kreeg dat voor elkaar, bijvoorbeeld door het document digitaal ‘schoon te poetsen’. Maar tegenwoordig ontvangen de meeste organisaties documentatie per mail in pdf-formaat. Het herkennen van teksten alléén is daarom niet meer zo’n ingewikkeld proces. Wat maakt OCR-software nu dan nog zo innovatief?

Alleen een OCR-systeem dat de gegevens ook kan interpreteren, springt er tegenwoordig nog uit. Reguliere OCR-software doet niets meer dan het omzetten van plaatje naar tekst. Een interpretatieslag maakt het verschil. Maar hoe werkt OCR wanneer het aankomt op het interpreteren van een document? Precies zoals het klinkt: de software begrijpt en verwerkt de data die erop staan. Dit kunnen onder andere een factuurnummer, een vervaldatum en een ordernummer zijn.

 

Hoe helpt OCR-software bij het eenvoudiger verwerken van documenten?

Het antwoord op die vraag heeft alles te maken met het interpretatievermogen van de OCR-software. Op het moment dat je een document aanbiedt, bepaalt het OCR-systeem met wat voor soort document het te maken heeft. Op basis daarvan zoekt het naar specifieke velden of woorden. Hierbij is ‘kwaliteit’ een sleutelwoord: slechte OCR-software interpreteert de data niet correct, terwijl goede OCR-software zaken als factuur- en vervaldatum prima van elkaar kan onderscheiden en het meest waarschijnlijke scenario schetst. Dit stelt het systeem vervolgens aan je voor, zodat jij alleen nog even een controle hoeft uit te voeren.

De beste OCR-software vinden: waarop moet je letten?

Als je op zoek gaat naar de beste OCR-software voor jouw organisatie, is het belangrijk om eerst te bepalen met welk doel je een OCR-oplossing wilt gebruiken. Hoe meer documenttypes je bijvoorbeeld wilt laten herkennen, hoe intelligenter de software moet zijn.

Er is gratis OCR-software beschikbaar, onder meer via Google. Als je hier een document aanbiedt ter herkenning, heb je het binnen 1 seconde terug. Maar reken niet op enige interpretatie van de gegevens. Je ziet een grote brei van woorden achter elkaar staan en zal zelf moeten uitvissen waar die allemaal voor staan. Het kost niets, maar je hebt er ook niet veel aan – zeker niet wanneer je pagina’s aan tekst hebt. Als je echt wat uit een OCR-oplossing wilt halen, is het belangrijk dat je kiest voor intelligente software.

Maar hoe werkt OCR die slim is? Het uitgangspunt is dat het herkennings- en interpretatieproces automatisch verloopt, zodat jij geen saai, repeterend (invoer)werk meer hoeft te verrichten. Dit betekent bijvoorbeeld dat de herkenningsgraad bij aanvang al heel hoog is, dat je geen templates hoeft aan te maken met de hand en dat de software automatisch een correctie aanbrengt wanneer de herkenning niet direct 100% is. De meeste partijen bieden deze slimme OCR-software niet. Maar het is wel verstandig om hiervoor te kiezen, omdat je alleen zo álles uit OCR kunt halen.

Volgende stappen: hoe werkt OCR in de toekomst?

Van oudsher richt OCR-software zich vooral op het verwerken van inkoopfacturen. Maar met de digitalisering van documenten wordt de stroom van inkomende documenten steeds meer divers. En die stroom moet je op eenduidige wijze kunnen verwerken in je financieel-administratieve systeem.

Daarnaast is er steeds meer sprake van documenten die aan facturen gekoppeld zijn, zoals pakbonnen of hr-onboardingformulieren. Ook daarop moeten slimme OCR-technieken worden toegepast. Een goede interpretatie van de gegevens zorgt er immers voor dat deze correct in het achterliggende (ERP-)systeem worden geregistreerd. Dat scheelt je een grote hoeveelheid werk.

Dat de flexibiliteit van OCR-software in toenemende mate belangrijk is, komt doordat documenten steeds minder gestructureerd zijn. Waar OCR zich vroeger alleen kon focussen op 1 bepaald documenttype met een vaste indeling (zoals een inkoopfactuur), moet het nu allerlei formats en lay-outs kunnen herkennen. Daar heb je enorm slimme OCR-software voor nodig.

Dus hoe werkt OCR dan in de toekomst? Misschien bewegen we toe naar 1 grote mailbox waarin alle documenttypes terechtkomen om door de OCR-software te worden herkend en verwerkt. (Wanneer het om inkoopfacturen gaat, heeft WhiteVision hiervoor overigens al een oplossing: de SMART E-mail-handler.) En wellicht is er naast Optical Character Recognition straks ook sprake van beeldherkenning. Wat als software de gezichten op een foto via socialmediaprofielen direct van een naam kan voorzien? Of kan berekenen wat de glasoppervlakte in de gevel van een kantoorpand is? Hoe slim kan OCR dán worden?

Meer weten over slimme OCR-software?

WhiteVision biedt een zelflerende OCR-oplossing die alle opgedane kennis deelt binnen de gebruikerscommunity. Het gebruiksgemak is optimaal, de software corrigeert zichzelf automatisch en alle gebruikers profiteren van het steeds slimmer wordende systeem. Bovendien ontwikkelen wij onze oplossing continu door, zodat zij toekomstbestendig is én blijft.

Weten hoe onze unieke OCR-oplossing werkt? Neem gerust eens contact met ons op.
We bespreken de mogelijkheden graag met je.

 

Sfeerfoto Malou - Renee

Wil jij jouw proces slimmer inrichten?

april 2024

Tijd om je aan te sluiten bij het Peppol-netwerk? Dít moet je weten!

Van steeds meer kanten hoor je over het Peppol-netwerk. Misschien ontvangt en verstuurt jouw organisatie af en toe ook al facturen via Peppol. Of je bent je momenteel aan het oriënteren op een goede ‘Peppol-aanpak’. Is dit het juiste moment voor jou om je bij het Peppol-netwerk aan te sluiten? En wat houdt dat nu eigenlijk precies in? In deze blogpost zetten we de belangrijkste ‘Peppol-feiten’ voor je op een rij!
Artikel lezen
maart 2024

Op de kunstmatige-intelligentie-trein springen? Zó profiteren inkoop en finance van AI

Op het gebied van kunstmatige intelligentie (ook wel ‘Artificial Intelligence’ of, afgekort, ‘AI’ genoemd) gebeurt ontzettend veel. Van meetings samenvatten tot video’s produceren: bots kunnen steeds meer. De tools vliegen je om de oren. En nu de wereld steeds slimmer wordt, wil jij vanuit de inkoop- of financeafdeling óók best graag op de kunstmatige-intelligentie-trein springen. Maar dan wel op zó’n manier dat je jouw werk er makkelijker mee maakt. In jouw geval betekent dit waarschijnlijk dat je repetitieve, saaie taken wilt automatiseren. Zo kan je je immers focussen op werkzaamheden die je leuk vindt en die jou meer uitdaging bieden. Maar welke mogelijkheden zijn nu écht interessant voor de inkoop- en financeafdelingen?
Artikel lezen
maart 2024

Mag je facturen digitaal bewaren?

Facturen digitaal bewaren: je hoort er steeds meer over, maar je kampt met de nodige vragen. Want mag dit eigenlijk wel? En zo ja, waar begin je dan? Hoewel er voor het digitaal boeken van inkoopfacturen tegenwoordig slimme oplossingen bestaan, is het archiveringsproces binnen veel organisaties nog steeds papiergebonden. Menig financieel-administratief medewerker is anno 2019 nog altijd veel tijd kwijt aan het opbergen van inkoopfacturen in mappen, die worden bewaard in kasten op het kantoor. Zo’n papieren archief maakt het terugvinden van een factuur op een later tijdstip óók een tijdrovende taak. Herkenbaar? Dan overweeg je misschien een efficiënter alternatief: facturen digitaal bewaren. Maar waarmee moet je rekening houden als je overstapt op een digitaal archief?
Artikel lezen

123