Den Danske Ordbog

Navn på bevillingshaver

DSL - Karen Skovgaard-Petersen

Institution

Det Danske Sprog- og Litteraturselskab

Beløb

DKK 7,083,865

År

2021

Bevillingstype

Research Infrastructure

Hvad?

Projektets formål er at udvide, udvikle og opdatere Den Danske Ordbog. Den Danske Ordbog rummer mere end 100.000 opslagsord og beskrivelser af deres udtale, betydning, brug og oprindelse m.m. Den Danske Ordbog er en deskriptiv ordbog. Den hviler på det princip at en beskrivelse af ordenes betydning og brug må baseres på grundige og systematiske undersøgelser af, hvordan sprogbrugerne faktisk og aktuelt bruger ordene. Ordbogen er korpusbaseret, hvilket vil sige, at den udarbejdes på grundlag af en stor samling autentiske tekster i digital form. Ordbogen skal ikke alene løbende udvides med nye ord og udtryk, men også ord og udtryk der allerede står i ordbogen, skal underkastes stadig revision med henblik på at registrere ændringer i betydning, konstruktion, sprogbrug, udtale m.m.

Hvorfor?

For forskere i moderne dansk sprog er Den Danske Ordbog den centrale kilde til autoritativ og løbende opdaterede oplysninger om ordenes betydning, brug, konstruktion etc. Også for forskningen i sprogudvikling er ordbogen uundværlig. Dette aspekt vil blive styrket gennem udviklingen af et historisk visningsformat, der tillader tilbageblik på ældre versioner af ordbeskrivelserne. Udviklingen af dansksproget sprogteknologi er helt afhængig af kvaliteten af de tilgrundliggende data. De data og digitale værktøjer, som er udviklet af DSL i forbindelse med ordbogsarbejdet, er stærkt efterspurgte af forskere inden for dansk sprogteknologi. Data fra Den Danske Ordbog indgår således som grundlag i udviklingen af en fælles dansk sprog ressource til AI-formål, COR (Centralt OrdRegister for dansk).

Hvordan?

Selve produktionen af de enkelte ordopslag foregår ved at ordbogsredaktøren på grundlag af det store tekstkorpus udvælger frekvente nye ord (og nye betydninger af eksisterende ord) og derpå foretager semantiske analyser og undersøger konstruktioner, sprogbrug m.m. Også brugerhenvendelser kan være udgangspunkt for undersøgelser af et ords hyppighed. Der knytter sig mange datalingvistiske processer til dette leksikografiske arbejde. Den tilgrundliggende database kræver fx stadig vedligehold, tekstkorpus skal løbende udbygges, gerne med flere skønlitterære tekster, og en igangværende ombygning af DSLs ordbogsplatform vil bl.a. betyde at DSLs mange digitaliserede historiske ordbøger umiddelbart vil kunne integreres i fælles søgninger.

Tilbage til oversigtssiden