Nyt digitaliserings- redskab gør kilder fra 1700-tallet bredt tilgængelige

Publiceret:

14.01.2022

Tags:

Et danskledet forskningsprojekt støttet af Carlsbergfondet har banet vejen for, at forskere lettere kan få adgang til historiske kilder fra 1700-tallet. Konkret har forskerne udviklet en ny AI-model på platformen Transkribus, der kan fremsøge og læse forskellige administrative håndskrifter med 95 procents nøjagtighed.

Danske forskere har udviklet et nyt redskab af stor værdi for danske og norske forskere med interesse for 1700-tallets historiske kilder. Redskabet er udviklet i regi af forskningsinfrastrukturprojektet ’Making the 18th century accessible’, der ledes af lektor i historie på Aarhus Universitet Nina Javette Koefoed.

Konkret gør redskabet, en AI-model udviklet i programmet Transkribus, håndskrevne dokumenter fra 1700-tallet søgbare og dermed lettere at tilgå og analysere. Store mængder af kilder, som tidligere har været stort set umulige at finde og bruge, kan dermed inddrages i forskningen og give ny viden om 1700-tallets samfund.

Af stor værdi for 1700-talsforskere

Det kan for eksempel dreje sig om kilder til dele af centraladministrationens virke. Eller der kan være tale om retsprotokoller, hvor man nu kan søge efter bestemte sagstyper. Redskabet gør det også muligt på sigt at forbinde de forskellige kildeserier på nye måder. Det vil give nye indsigter i, hvordan samfundet har hængt sammen, og hvilke dynamikker der for eksempel har drevet lovgivningen.

”Modellen vil have stor værdi for 1700-talsforskere i Danmark og Norge, der nu kan bruge den på deres eget materiale. Den kan være med til at ændre måden, hvorpå vi digitaliserer og publicerer kilder fra perioden. Og den kan bidrage til at øge mængden af open data. Alt sammen kan det skabe grundlag for en øget – og måske ændret – viden om 1700-tallets danske samfund og dermed den periode, der gik forud for vores demokrati og velfærdsstat”, siger Nina Javette Koefoed.

Læser med 95 procents nøjagtighed

Baggrunden for at igangsætte forskningsprojektet var et ønske om at udnytte et omfattende kildemateriale, som ellers ikke var tilgængeligt. Første del af projektet bestod i at udvikle en ’artificial intelligense’-model i programmet Transkribus, der kan læse 1700-tals gotisk håndskrift. Transkribus er en platform, der er udviklet til at maskinlæse historiske dokumenter.

Dernæst skulle forskerne bygge en tekstdatabase, hvor de store mængder kilder, som modellen er trænet på, kan tilgås på en måde, der tillader, at data kan analyseres gennem digitale metoder, som ellers ikke kan anvendes på de håndskrevne kilder. 

”Modellen i Transkribus er en universel model, der læser forskellige administrative håndskrifter med en 95 procents nøjagtighed”, forklarer Nina Javette Koefoed. Modellen, der allerede nu er gjort tilgængelig for andre forskere, kan trænes af den enkelte forsker til at opnå en endnu højere nøjagtighed på deres specifikke materiale, hvis det er skrevet med den samme håndskrift.

Trænet på 6000 sider

Desuden kan modellen bruges til at lære studerende at læse 1700-tals håndskrift samt gøre kilderne tilgængelige i forbindelse med deres opgave- og specialeskrivning. På den måde er modellen med til at sikre, at der stadig kan undervises kildebaseret i 1700-tallets historie.

Modellen er udviklet sammen med 4 studentermedhjælpere, der har arbejdet med at opmærke de scannede håndskrevne sider og læse korrektur på den maskinlæste tekst. Modellen er trænet på ca. 6000 sider.

Abonnér på nyt fra Carlsbergfondet

Ønsker du at følge med i vores videnformidling og aktiviteter generelt? Eller er du forsker og interesseret i nyheder, der vedrører vores opslag og uddelinger? Så tilmeld dig et af vores nyhedsbreve.