Van PDF tot inzicht in 8 stappen

Upload een jaarverslag of subsidieverantwoording en ontvang binnen minuten een complete financiele analyse. Hieronder leggen we stap voor stap uit hoe de AI-pipeline werkt — van tekstextractie tot downloadbaar rapport.

Stap 1 van 8

Upload je document

Alles begint met een simpele upload. Sleep je PDF naar het uploadgebied of klik om een bestand te selecteren. Je kunt jaarverslagen, jaarrekeningen, subsidieverantwoordingen en andere financiele documenten aanleveren. Het maakt niet uit of het een stichting, vereniging, gemeente of woningcorporatie betreft — Inzicht verwerkt documenten van alle rechtsvormen en sectoren.

Je bestand wordt direct versleuteld verzonden naar onze server in Duitsland. Daar blijft het tijdelijk staan terwijl de analyse draait. Zodra de analyse is afgerond, wordt het oorspronkelijke PDF-bestand automatisch verwijderd. Dit gebeurt altijd binnen twee uur. Je hoeft hier niets voor te doen — het is ingebouwd in het systeem.

Er geldt een maximale bestandsgrootte van 50 megabyte. De meeste jaarverslagen en jaarrekeningen vallen ruim binnen deze limiet. Heb je een groter document? Splits het dan op in losse bestanden en upload ze apart, of neem contact met ons op voor maatwerkoplossingen.

Technisch detail

Maximaal 50 MB per bestand. Ondersteunde formaten: PDF. Tijdelijke opslag op Europese server, automatisch verwijderd binnen 2 uur na analyse.

Stap 2 van 8

OCR & Tekstextractie

Niet elk PDF-bestand bevat doorzoekbare tekst. Oudere documenten, gescande jaarrekeningen of ingescande subsidiedossiers bevatten vaak alleen afbeeldingen van tekst. Inzicht herkent dit automatisch en schakelt over naar optische tekenherkenning (OCR). We gebruiken pdfplumber voor documenten met native tekst en pytesseract voor gescande bestanden — beide industriestandaarden.

De extractie verloopt pagina voor pagina. Tabellen worden herkend en gestructureerd, zodat financiele gegevens in de juiste kolommen terechtkomen. Dit is cruciaal: een verkeerd gelezen bedrag of een verschoven decimaal kan de hele analyse vertekenen. Daarom valideren we geextraheerde getallen met patroonherkenning en controleberekeningen.

Onze OCR is geoptimaliseerd voor de Nederlandse taal. Dat klinkt als een detail, maar het maakt een groot verschil. Nederlandse financiele termen als 'vorderingen', 'overlopende passiva' en 'voorzieningen' worden betrouwbaarder herkend dan met een generieke Engelstalige OCR-engine. Het resultaat: schonere tekst, betere analyse.

Technisch detail

Gescand document? Geen probleem. OCR met Nederlandse taalherkenning via pytesseract. Native PDF-tekst via pdfplumber, inclusief tabeldetectie.

Stap 3 van 8

Sectordetectie

Een jaarverslag van een GGZ-instelling vraagt om andere benchmarks dan dat van een woningcorporatie of sportvereniging. Daarom detecteert Inzicht automatisch de sector van het document. De AI analyseert de taal, terminologie en financiele structuur om te bepalen met welk type organisatie we te maken hebben. In totaal onderkennen we 23 sectoren.

Op basis van de gedetecteerde sector worden sectorspecifieke benchmarks en risico-indicatoren geladen. Voor jeugdzorginstellingen kijken we bijvoorbeeld naar andere personeelskostenratio's dan voor onderwijsinstellingen. Bij woningcorporaties beoordelen we de ICR (interest coverage ratio) en de LTV (loan-to-value), terwijl bij culturele instellingen de subsidiegrens en eigen inkomsten-ratio leidend zijn.

De sectordetectie slaagt in meer dan 95% van de gevallen automatisch. Mocht het algoritme twijfelen — bijvoorbeeld bij een multisectorale stichting die zowel jeugdzorg als onderwijs biedt — dan worden benchmarks van beide sectoren meegenomen en kun je in het rapport zien welke sectorvergelijking is toegepast. Transparantie staat voorop.

Technisch detail

23 sectoren ondersteund: WMO, jeugdzorg, GGZ, onderwijs (PO/VO/MBO/HBO/WO), woningcorporaties, cultuur, sport, welzijn, kinderopvang, en meer. Automatische selectie van sectorspecifieke benchmarks.

Stap 4 van 8

Financiele Data Extractie

Dit is het hart van de analyse. De AI leest het volledige document en extraheert systematisch alle financiele posten. Op de balans gaat het om 44 regels — van materiele vaste activa en financiele vaste activa tot kortlopende schulden en voorzieningen. Uit de resultatenrekening worden 38 posten gehaald, waaronder baten, lasten, personeelskosten, afschrijvingen en het saldo.

Elk geextraheerd bedrag krijgt een confidence-score tussen 0 en 100 procent. Een score van 95% betekent dat het AI-model zeer zeker is dat het bedrag correct is geextraheerd en op de juiste post staat. Een score van 60% duidt op onzekerheid — misschien omdat het bedrag op meerdere plekken in het document voorkomt met verschillende waarden, of omdat de tabel slecht leesbaar was. In het resultaat zijn deze scores zichtbaar als kleurcoderingen: groen voor hoge confidence, oranje voor midden, rood voor lage confidence.

Naast de getallen slaat Inzicht de bronverwijzing op. Per bedrag weet je het paginanummer, de sectie en het exacte citaat uit het document. Dit maakt het mogelijk om elk getal terug te traceren naar de bron. Geen black box, maar verifieerbare resultaten. Bij een voortgangsgesprek kun je direct naar de juiste pagina verwijzen als een bedrag vragen oproept.

Technisch detail

44 balansregels en 38 resultaatposten. Elk veld krijgt een confidence-score (0-100%) en bronverwijzing: paginanummer, sectie en exact citaat.

Stap 5 van 8

Ratio's & Benchmarks

Met de geextraheerde data berekent Inzicht automatisch de belangrijkste financiele ratio's. De current ratio en quick ratio geven inzicht in de liquiditeitspositie — kan de organisatie op korte termijn aan haar verplichtingen voldoen? De solvabiliteitsratio laat zien hoe stevig het eigen vermogen is ten opzichte van het totale vermogen. En de rentabiliteit van het eigen vermogen vertelt of het geinvesteerde vermogen voldoende rendement oplevert.

Daarnaast berekenen we specifieke operationele ratio's. De personeelskosten-ratio is voor veel gesubsidieerde instellingen een van de belangrijkste indicatoren: als 68% van de baten opgaat aan personeel terwijl de sectornorm 54% is, dan is dat een signaal dat nader onderzoek verdient. Het werkkapitaal en de omzetgroei (of krimp) completeren het financiele beeld.

Elke ratio wordt vergeleken met sectorspecifieke benchmarks. Je ziet in een oogopslag of een organisatie boven, op of onder het sectorgemiddelde zit. De benchmarks zijn gebaseerd op openbare bronnen en CBS-data, aangevuld met inzichten uit honderden eerder geanalyseerde documenten. Zo krijg je niet alleen absolute cijfers, maar ook relatieve context — en dat is precies wat je nodig hebt om te beoordelen of een afwijking acceptabel is of niet.

Technisch detail

Berekend: current ratio, quick ratio, solvabiliteitsratio, rentabiliteit eigen vermogen, personeelskosten-ratio, werkkapitaal, omzetgroei. Vergeleken met sectorgemiddelden.

Stap 6 van 8

Rode Vlaggen

De rode-vlaggenmodule combineert twee benaderingen. Enerzijds zijn er regelgebaseerde checks: harde grenzen en bekende patronen die altijd een signaal opleveren. Denk aan een solvabiliteitsratio onder de 20%, een negatief werkkapitaal, of een plotselinge stijging van 'overige kosten' met meer dan 100%. Deze regels zijn gebaseerd op jarenlange ervaring met financiele toetsing in de publieke sector.

Anderzijds gebruikt de AI-gedreven detectie de context van het hele document. Waar een regelgebaseerd systeem alleen naar getallen kijkt, leest de AI ook de toelichtingen. Als een post 'Overige kosten' stijgt met 340% ten opzichte van vorig jaar en er staat geen verklaring in de toelichting, dan genereert de AI een rode vlag met de melding: 'Onverklaarbare post overige kosten van 87.340 euro — stijging van 340% zonder toelichting'. Een menselijke analist zou precies hetzelfde opmerken, maar de AI doet het in seconden.

Elke rode vlag krijgt een ernst-niveau: laag, midden, hoog of kritiek. Kritieke vlaggen duiden op potentiele continuiteitsproblemen of ernstige afwijkingen. Hoge vlaggen verdienen onderzoek in het voortgangsgesprek. Middenvlaggen zijn aandachtspunten, en lage vlaggen zijn informatief. In het rapport zijn ze gesorteerd op ernst, zodat je direct ziet wat de meeste aandacht verdient.

Technisch detail

Vier severity-niveaus: laag, midden, hoog, kritiek. Combinatie van regelgebaseerde patronen en AI-gedreven contextanalyse.

Stap 7 van 8

Slimme Vervolgvragen

Na de analyse genereert Inzicht concrete vervolgvragen die je direct kunt gebruiken in het voortgangsgesprek of de beoordeling. Deze vragen zijn niet generiek — ze zijn specifiek afgeleid uit de bevindingen van dit document. Als de personeelslasten 68% bedragen terwijl de sectornorm 54% is, krijg je de vraag: 'Kan de stichting de afwijking in personeelslasten ten opzichte van de sectornorm onderbouwen?' Als de reserves onder de 15%-grens liggen: 'Welke stappen neemt men om reserves boven de 15%-norm te krijgen?'

De vervolgvragen worden gegenereerd door de primaire AI (Claude) en vervolgens gevalideerd door een tweede model (GPT-4o). Deze cross-check zorgt ervoor dat vragen relevant, specifiek en niet-tendentieus zijn. Als beide modellen het eens zijn dat een vraag waardevol is, wordt deze opgenomen. Vragen waarover de modellen het oneens zijn, worden gefilterd of bijgesteld. Dit duale systeem verhoogt de kwaliteit aanzienlijk.

Het resultaat is een lijst van vijf tot vijftien vervolgvragen, elk gekoppeld aan een specifieke bevinding uit de analyse. Per vraag zie je de achtergrond (welk cijfer of welke rode vlag de aanleiding vormt) en de paginaverwijzing in het bronbestand. Zo kun je in het gesprek direct zeggen: 'Op pagina 23 van uw jaarverslag staat dat de overige kosten zijn gestegen met 340%. Kunt u dit toelichten?' Dat is specifiek, onderbouwd en professioneel.

Technisch detail

Context-aware vragen voor het voortgangsgesprek. Cross-check tussen Claude en GPT-4o voor kwaliteitsborging. Direct bruikbaar in subsidiegesprekken.

Stap 8 van 8

Rapport Generatie

Alle bevindingen worden samengevoegd tot downloadbare rapporten. Het hart is de Quickscan Excel — een ingevulde template waarin alle 44 balansregels en 38 resultaatposten staan, inclusief de confidence-kleurcoderingen. Groene cellen zijn betrouwbaar geextraheerd, oranje cellen verdienen een handmatige check, rode cellen zijn onzeker. Dit bespaart uren handmatig invulwerk en geeft direct een visueel overzicht van de datakwaliteit.

Naast de Excel genereert Inzicht een PDF-rapport met een managementsamenvatting. Hierin staan de belangrijkste bevindingen in begrijpelijke taal: de financiele gezondheid in een notendop, de significantste rode vlaggen, en de aanbevolen vervolgacties. Dit rapport is bedoeld om te delen met collega's, leidinggevenden of bestuurders die niet in de details hoeven te duiken maar wel het totaalbeeld willen zien.

Ten slotte bevat het rapport een lijst met concrete vervolgacties: welke vragen moet je stellen, welke documenten moet je eventueel opvragen, en welke risico's verdienen monitoring. Je kunt het rapport direct vanuit Inzicht per e-mail delen met collega's. Alle rapporten blijven zeven dagen beschikbaar om te downloaden, waarna ze automatisch worden verwijderd conform ons privacybeleid.

Technisch detail

Downloadbare formats: Quickscan Excel (ingevulde template met confidence-kleuring), PDF-rapport met managementsamenvatting, en concrete vervolgacties. Deel via mail met collega's.

Waar gaat je data naartoe?

Transparantie over de dataflow. Je document verlaat de EU-server alleen als tekst richting de AI API — nooit als origineel bestand.

Jouw PDF

Upload

EU Server

Duitsland

AI API

Tekst naar VS (EU-US DPF)

EU Server

Resultaten terug

Jij downloadt

Excel, PDF, acties

PDF verwijderd binnen 2 uur

Het originele bestand wordt automatisch gewist zodra de analyse is afgerond. Maximaal twee uur na upload is het bestand volledig verwijderd van onze servers.

Resultaten 7 dagen beschikbaar

De gegenereerde analyse (Excel, PDF-rapport, rode vlaggen) blijft zeven dagen beschikbaar om te downloaden. Daarna wordt alles automatisch verwijderd.

Hosting in Duitsland (EU)

De webserver, database en alle resultaten draaien in een datacenter in Duitsland. Je data blijft in de EU, behalve de tekst die naar de AI API gaat.

AI via EU-US Data Privacy Framework

Anthropic (Claude), Google (Gemini) en OpenAI (GPT-4o) zijn gecertificeerd onder het EU-US DPF. API-content wordt niet gebruikt voor modeltraining.

Waarom deze aanpak werkt

Financiele velden

44 balansregels + 38 resultaatposten, elk met confidence-score

Sectoren

Van WMO tot woningcorporaties, elk met eigen benchmarks

<5 min

Analysetijd

Van upload tot downloadbaar rapport in minder dan vijf minuten

Klaar om het zelf te zien?

Bekijk de interactieve demo om de pipeline in actie te zien, of start direct met je eigen analyse. De eerste twee analyses zijn gratis.

Bekijk de demo Start analyse

Geen account nodig. Upload een PDF en ontvang binnen minuten je analyse.