Bij het uitzoeken of vervanging met terugwerkende kracht mogelijk is loop ik tegen de uitvoering van een steekproef aan. Bij onze externe archiefopslag ligt zo'n 769 meter aan gescande documenten in archiefdozen, ordners en archiefboxen.

Voor de steekproef heb ik eerst het aantal pagina's proberen in te schatten:

769 meter x 5000 pagina's per meter = 3.845.000 pagina's

5000 pagina's p/m heb ik aan de hand van enkele bronnen bepaald. Een aanbesteding van omgevingsvergunningen gaat uit van 3450 p. p/m, een website van een uitvoerder gaat uit van 5600 pagina's in 14 ordners en tot slot een andere uitvoerder gaat uit van 6000 p. p/m bij het berekenen van de prijs. Met 5000 zit ik redelijk nabij het gemiddelde. Het aantal pagina's is dus ingeschat. Maar nu verder met de vraag hoe groot moet de steekproef zijn.

Ook hier heb ik meerdere bronnen geraadpleegd. De Steekproefcalculator van het Nationaal Archief geeft voor een populatiegrootte van 3.850.000 (ja waarom ik er hier 5000 pagina's bij verzonnen heb is mij ook een raadsel) en een betrouwbaarheidsinterval van 95%, Spreiding van 50% en een Foutmarge van 2% een steekproef van 2399.
Via de website van Ingmar Koch heb ik AQL methodiek doorlopen. Dan kom ik uit op een steekproef van 1250 voor inspection level 2 en 2000 voor inspection level 3.

Mijn conclusie en ik hoop dat jullie die met mij delen is dat ik voor over 3.845.000 pagina's een steekproef van 2000 pagina's voldoen is om de kwaliteit vast te stellen.

Daarnaast moet er natuurlijk ook nog een foutmarge worden vastgesteld. Maar dat is iets waar ik later ga vaststellen. Eerst wil ik weten of het aantal van de steekproef geschikt is.

Ik lees graag hoe iedereen hier tegenaan kijkt.

Alvast bedankt, Jan-Jaap

Weergaven: 139

Hierop reageren

Berichten in deze discussie

Dit is hoe het hier vaak wordt uitgevoerd:

  • Zaken met een bewaartermijn van 1-5  jaar: 10 % controle; 
  • Zaken met een bewaartermijn van 1-10 jaar:  20 % controle; 
  • Zaken met een bewaartermijn van 10 jaar: 50 % controle;  
  • Zaken met permanente bewaartermijn 100% controle.  

In mijn ervaring is 5% visuele controle van alle images bij grootschalige conversie via scanning een veilige keuze voor kwaliteitscontrole. Dit heb ik ook toegepast bij controles van tal van grote scanproducties en in de praktijk blijkt dit voldoende representatief. Jouw uitgangspunt van 5.000 vel per meter is inderdaad een redelijk uitgangspunt, maar vergeet niet dat een bepaald percentage van de collectie dubbelzijdig geprint/beschreven zal zijn. 

Bij die controles hanteer ik twee verschillende cijfers voor het vaststellen van een geaccepteerde foutmarge. Hierbij maak ik onderscheid tussen lichte fouten en zware fouten.

Lichte fouten zijn die fouten die de informatie op de documenten niet compromitteren, maar meer cosmetisch van aard zijn, zoals iets te licht of te donker of iets te scheef. kortom alle fouten zolang er maar geen informatie (deels of geheel)wegvalt of onleesbaar wordt. Voor lichte fouten ga ik meestal uit van een geaccepteerde tolerantie van 2 procent.

Zware fouten zijn die fouten waarbij informatie deels of geheel wegvalt of niet meer leesbaar is. Voor zware fouten ga ik meestal uit van 2 of 3 promille. Een uitgebreidere beschrijving hiervan heb ik eerder op Breed geplaatst, zie: Steekproef scans en het acceptabele foutpercentage - BREED - over d....

Antwoorden op discussie

RSS

© 2025   Gemaakt door Marco Klerks.   Verzorgd door

Banners  |  Een probleem rapporteren?  |  Algemene voorwaarden