Handwritten Text Recognition (HTR) bij het Noord-Hollands Archief

bron: website Noord-Hollands Archief

Het Noord-Hollands Archief beheert ongeveer 55 strekkende kilometer aan archieven en collecties, waarvan ongeveer de helft bestaat uit handgeschreven teksten. Slechts van het spreekwoordelijke ‘topje van de ijsberg’ is de inhoud bekend. Maar wat nou als je die handgeschreven teksten woordelijk zou kunnen doorzoeken? Dit is mogelijk door geautomatiseerde transcripties van deze teksten te laten maken door de computer. Deze techniek wordt Handwritten Text Recognition (HTR) genoemd.

Hier willen wij ons in verdiepen. Daarom zijn wij een overeenkomst aangegaan met het programma Transkribus, ontwikkeld door Universiteit Innsbruck en onderdeel van het door de Europese Unie gesubsidieerde project READ (Recognition and Enrichment of Archival Documents). Met behulp van dit programma willen wij een pilot uitvoeren op de grote correspondentieseries die te vinden zijn in het archief van het gemeentebestuur van Haarlem over de periode 1886-1898. Ons doel is om aan het brede publiek te laten zien welke documenten hierin te vinden zijn en als het ware de inhoud die schuil gaat onder het topje van de ijsberg zichtbaar te maken. Misschien lukt het ons zelfs om de hele ijsberg zichtbaar te maken!

De computer die de transcripties voor ons gaat maken moet eerst ‘getraind’ worden. Hiervoor moeten wij handmatig transcripties maken, waarbij we wel wat hulp kunnen gebruiken! Wil jij ons ondersteunen bij dit project? Stuur een e-mail naar info@noord-hollandsarchief.nl, t.a.v. Nico Vriend.

Weergaven: 189

Opmerking

Je moet lid zijn van BREED - over de grenzen van informatie om reacties te kunnen toevoegen!

Wordt lid van BREED - over de grenzen van informatie

© 2024   Gemaakt door Marco Klerks.   Verzorgd door

Banners  |  Een probleem rapporteren?  |  Algemene voorwaarden