Pdf en OCR: hoe lees je pdf-documenten uit met OCR-software?

Op de financiële administratie krijg je een veelheid aan documenten binnen. Vaak gaat het om pdf’s. En deze wil je op de meest efficiënte manier verwerken. Hoe pak je dat aan? Wie processen serieus wil optimaliseren, kan tegenwoordig niet meer zonder automatiseringsoplossingen. In dat kader heb je misschien de term ‘pdf OCR’ gegoogeld. Je weet dat OCR (de afkorting voor ‘Optical Character Recognition’) iets kan betekenen in het verwerken van pdf-documenten, zoals inkoopfacturen. Maar wat precies?

OCR + pdf-bestanden: korte uitleg

Gescande documenten en pdf-documenten converteren tot digitale versies die je kan bewerken en archiveren: dát is wat OCR-software doet. Je zet contracten, brieven, artikelen, handleidingen en rapporten in een handomdraai om naar bewerkbare teksten.

Patroonherkenning ligt ten grondslag aan OCR. Nadat de software een tekst heeft gescand, destilleert hij letters, cijfers en leestekens op pixelniveau. Hier komen woorden en tekst uit. Het resultaat: een doorzoekbaar digitaal document dat je kan bewerken. (Meer weten? Lees onze blog ‘Wat is OCR?‘)

OCR wordt vaak ingezet om inkoopfacturen, declaraties, werkbonnen, servicemeldingen en hr-dossiers uit te lezen. Waarom? Dit zijn veelal pdf’s die financieel-administratief medewerkers van oudsher overtypen. Lees je een pdf-bestand uit met OCR, dan hoef je deze tijdrovende, foutgevoelige taak niet meer uit te voeren. Handig, want zo houd je tijd over voor niet-repeterende werkzaamheden die je uitdaging bieden en waarmee je meer waarde toevoegt voor de organisatie.

Download Whitepaper

 

Hoe gaan we op korte en lange termijn om met de ontwikkelingen op het gebied van digitale factuurverwerking? We vertellen je er alles over in ons whitepaper ‘De toekomst van inkoopfactuurverwerking: hoe maak je je administratieve proces toekomstbestendig?’

 

Download whitepaper

Slimme OCR-software: de verstandigste keuze

Reguliere OCR-software doet eigenlijk niets meer dan documenten omzetten naar tekst. Aan deze basale vorm van tekstherkenning heb je in de praktijk niet veel, omdat je dan alsnog een interpretatieslag moet doen. Een slim OCR-systeem biedt uitkomst: het herkent de gegevens op pdf-documenten en interpreteert deze om een logisch resultaat aan je te presenteren. Een voorbeeld: als er 6 cijfers achter het woord ‘factuurnummer’ staan, begrijpt het OCR-systeem de context en herkent het de cijfers als het factuurnummer.

In sommige gevallen herkent de OCR-software een bepaald element op het pdf-document niet in één keer. Op zulke momenten kan je het systeem trainen door eenvoudig aan te klikken wat het had moeten herkennen. Omdat slimme OCR-software een zelflerend vermogen heeft, zal de herkenning van het bewuste element de volgende keren wél goed gaan. Bovendien profiteren alle gebruikers van de ‘geleerde les’, omdat deze wordt doorgevoerd in het systeem!

De waarde van een totaaloplossing

Nadat het OCR-systeem de velden op een pdf-document heeft herkend, doet het een geautomatiseerd voorstel. Dit betekent dat jij de afzonderlijke velden niet meer handmatig hoeft in te vullen wanneer je een pdf-bestand verwerkt.

Maar daar hoeft het niet bij op te houden. Als je voor iedere pdf OCR inzet, is het vaak ook mogelijk om andere handelingen in je administratieve proces te automatiseren. Ben je hierin geïnteresseerd, kies dan voor een totaaloplossing. Hiermee kan je inkoopfacturen met een projectnummer bijvoorbeeld automatisch koppelen aan een bepaalde projectleider, zodat deze de factuur ter goedkeuring ontvangt. Dit verloopt via geavanceerde workflow-software, die het mogelijk maakt om een herkende factuur altijd en overal digitaal te accorderen.

Voor elke pdf OCR inzetten?

Met slimme OCR-software elimineer je veel repeterende handelingen die je verricht wanneer je een pdf-bestand handmatig verwerkt.

Benieuwd hoe jij kan profiteren van de OCR-herkenning van allerlei soorten pdf-bestanden? Neem gerust eens contact met ons op. We bespreken graag wat de slimme totaaloplossing van WhiteVision kan betekenen in het verwerken van jouw pdf’s.

Lars Geraeds, teamlead support

 

contact opnemen