* | Carlsbergfondet
Til bevillingsoversigt

Den Danske Ordbog, forskningsinfrastruktur og sproglig public service

Forskningsinfrastruktur

What

Projektets formål er at udvide, udvikle og opdatere Den Danske Ordbog. Den Danske Ordbog rummer mere end 100.000 opslagsord og beskrivelser af deres udtale, betydning, brug og oprindelse m.m. Den Danske Ordbog er en deskriptiv ordbog. Den hviler på det princip at en beskrivelse af ordenes betydning og brug må baseres på grundige og systematiske undersøgelser af, hvordan sprogbrugerne faktisk og aktuelt bruger ordene. Ordbogen er korpusbaseret, hvilket vil sige, at den udarbejdes på grundlag af en stor samling autentiske tekster i digital form. Ordbogen skal ikke alene løbende udvides med nye ord og udtryk, men også ord og udtryk der allerede står i ordbogen, skal underkastes stadig revision med henblik på at registrere ændringer i betydning, konstruktion, sprogbrug, udtale m.m.

Why

For forskere i moderne dansk sprog er Den Danske Ordbog den centrale kilde til autoritativ og løbende opdaterede oplysninger om ordenes betydning, brug, konstruktion etc. Også for forskningen i sprogudvikling er ordbogen uundværlig. Dette aspekt vil blive styrket gennem udviklingen af et historisk visningsformat, der tillader tilbageblik på ældre versioner af ordbeskrivelserne. Udviklingen af dansksproget sprogteknologi er helt afhængig af kvaliteten af de tilgrundliggende data. De data og digitale værktøjer, som er udviklet af DSL i forbindelse med ordbogsarbejdet, er stærkt efterspurgte af forskere inden for dansk sprogteknologi. Data fra Den Danske Ordbog indgår således som grundlag i udviklingen af en fælles dansk sprog ressource til AI-formål, COR (Centralt OrdRegister for dansk).

How

Selve produktionen af de enkelte ordopslag foregår ved at ordbogsredaktøren på grundlag af det store tekstkorpus udvælger frekvente nye ord (og nye betydninger af eksisterende ord) og derpå foretager semantiske analyser og undersøger konstruktioner, sprogbrug m.m. Også brugerhenvendelser kan være udgangspunkt for undersøgelser af et ords hyppighed. Der knytter sig mange datalingvistiske processer til dette leksikografiske arbejde. Den tilgrundliggende database kræver fx stadig vedligehold, tekstkorpus skal løbende udbygges, gerne med flere skønlitterære tekster, og en igangværende ombygning af DSLs ordbogsplatform vil bl.a. betyde at DSLs mange digitaliserede historiske ordbøger umiddelbart vil kunne integreres i fælles søgninger.

SSR

Den Danske Ordbog er ikke alene en central sproglig forskningsinfrastruktur. Den yder også direkte og frit tilgængelig sproglig førstehjælp til 130.000 mennesker hver dag. Den er med til at gøre os alle til bedre sprogbrugere, og det gavner den offentlige debat: En lødig offentlig debat forudsætter, at vi er enige om ordenes betydning og brug.